• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

AI Sleeper Agents: How Anthropic Trains and Catches Them скачать в хорошем качестве

AI Sleeper Agents: How Anthropic Trains and Catches Them 2 месяца назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
AI Sleeper Agents: How Anthropic Trains and Catches Them
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: AI Sleeper Agents: How Anthropic Trains and Catches Them в качестве 4k

У нас вы можете посмотреть бесплатно AI Sleeper Agents: How Anthropic Trains and Catches Them или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон AI Sleeper Agents: How Anthropic Trains and Catches Them в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



AI Sleeper Agents: How Anthropic Trains and Catches Them

In this video, we explain how Anthropic trained "sleeper agent" AIs to study deception. A "sleeper agent" is an AI model that behaves normally until it encounters a specific trigger in the prompt, at which point it awakens and executes a harmful behavior. Anthropic found that they couldn't undo the sleeper agent training using standard safety training, but they could detect sleeper agents through a simple interpretability technique. ▀▀▀▀▀▀▀▀▀SOURCES & READINGS▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ Sleeper agents: training deceptive LLMs that persist through safety training: https://www.anthropic.com/research/sl... https://www.alignmentforum.org/posts/... Simple probes can catch sleeper agents: https://www.anthropic.com/research/pr... Alignment Faking in Large Language Models (mentioned in passing as a more natural demonstration of deceptive alignment): https://www.anthropic.com/research/al... ▀▀▀▀▀▀▀▀▀PATREON, MEMBERSHIP, MERCH▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ 🟠 Patreon:   / rationalanimations   🔵 Channel membership:    / @rationalanimations   🟢 Merch: https://rational-animations-shop.four... 🟤 Ko-fi, for one-time and recurring donations: https://ko-fi.com/rationalanimations ▀▀▀▀▀▀▀▀▀SOCIAL & DISCORD▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ Rational Animations Discord:   / discord   Reddit:   / rationalanimations   X/Twitter:   / rationalanimat1   Instagram:   / rationalanimations   ▀▀▀▀▀▀▀▀▀PATRONS & MEMBERS▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ A Alcher Black Alex Hall Amir Saboury Apuis Retsam blasted0glass Bleys BlueNotesBlues bparro Chad M Jones Chris Painter Christian Loomis Colin Ricardo Craig Falls Danealor Danilo Stefani - Alessandra Erba David Piepgrass Dawson Ducky Edward Yu Ellis Jones Felix Akkermans Forodriac Origamius Fraser Cain Gabriel Ledung Glenn Tarigan Honyopenyoko Ingvi Gautsson Ivan Bachcin Jackson Emanuel James Babcock Jana JanJan Jasper L Jeroen De Dauw joe39504589 John John Everett-Slape Joshua Adrian Cahyono Juan Benet Klemen Slavic Kristin Lindquist loopuleasa Luke Freeman Martin Skalstad Steen Matthew Shinkle Michael Andregg Michael Hewitt Nathan Fish Nathan Metzger Neal Strobl NMS noggieB Odet Abadia rictic Robert Paul Schwin Scott Alexander SQRT42Pi steven michaels Stuart Alldritt Superslowmojoe Terberlo.dog Tomas Campos Tor Barstad ttw Vladimir Silyaev Fede Mathieu ronvil Michael Suazo rx Laissez Scholar BestProGaming 7ic7ac Devin King RED Rinthean Thomas Grip Boris Bend J H Richard Stambaugh Teo Val Ken Mc Alcher Black AWyattLife Torstein Haldorsen MichaÅ‚ ZieliÅ„ski ▀▀▀▀▀▀▀CREDITS▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ Directed by: Hannah Levingstone | @hannah_luloo Writers: John Burden Producer: Emanuele Ascani Art Director: Hané Harnett | @Peony_Vibes / @peonyvibes (insta) Line Producer: Kristy Steffens | https://linktr.ee/kstearb Production Managers: Jay McMichen | @Jay_TheJester Kristy Steffens | https://linktr.ee/kstearb Grey Colson | https://linktr.ee/earl.gravy Quality Assurance Lead: Lara Robinowitz | @CelestialShibe Storyboard Artists: Emmalaine Wright | @emmalainearts (insta) Hannah Levingstone | @hannah_luloo Ira Klages | @dux Lead Animators & Q/A: Ethan DeBoer | https://linktr.ee/deboer_art Lara Robinowitz | @CelestialShibe Owen Peurois | @owenpeurois Animators: Colors Giraldo | @colorsofdoom Ethan DeBoer https://linktr.ee/deboer_art Ira Klages | @dux Jay McMichen | @Jay_TheJester Jodi Kuchenbecker | @viral_genesis (insta) Jordan Gilbert | @Twin_Knight (twitter) Twin Knight Studios (YT) Keith Kavanagh | @johnnycigarettex Lara Robinowitz | @CelestialShibe Michela Biancini Owen Peurois | @owenpeurois Patrick O' Callaghan | @patrick.h264 Patrick Sholar | @Sholarscribbles Renan Kogut | @kogut_r Skylar O'Brien | @mutodaes Vaughn Oeth | @gravy_navy Zack Gilbert | @Twin_Knight (twitter) Twin Knight Studios (YT) Background Lead: Pierre Broissand | @pierrebrsnd (insta) / artstation.com/brsnd Asset/Background Artists: Emmalaine Wright | @emmalainearts (insta) Hané Harnett | @peonyvibes (insta) @peony_vibes (twitter) Olivia Wang | @whalesharkollie Pierre Broissand | @pierrebrsnd (insta) / artstation.com/brsnd Zoe Martin-Parkinson | @zoemar_son Compositing Lead: Renan Kogut | @kogut_r Compositing: Grey Colson | https://linktr.ee/earl.gravy Ira Klages | @dux Patrick O' Callaghan | @patrick.h264 Renan Kogut | @kogut_r Narrator: Rob Miles |    / robertmilesai   VO Editor: Tony Dipiazza Original Soundtrack & Sound Design: Epic Mountain

Comments
  • What a 100-year-old horse teaches us about AI 14 часов назад
    What a 100-year-old horse teaches us about AI
    Опубликовано: 14 часов назад
  • Это инопланетное послание 1 год назад
    Это инопланетное послание
    Опубликовано: 1 год назад
  • The Problem with A.I. Slop! - Computerphile 1 день назад
    The Problem with A.I. Slop! - Computerphile
    Опубликовано: 1 день назад
  • How One Career Can Save a Million Lives 1 год назад
    How One Career Can Save a Million Lives
    Опубликовано: 1 год назад
  • «Макс» — только начало: Кремль закладывает фундамент для цифрового железного занавеса | Разборы 1 день назад
    «Макс» — только начало: Кремль закладывает фундамент для цифрового железного занавеса | Разборы
    Опубликовано: 1 день назад
  • LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры 1 год назад
    LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры
    Опубликовано: 1 год назад
  • Y'all mind if I complain for 15 minutes? 12 часов назад
    Y'all mind if I complain for 15 minutes?
    Опубликовано: 12 часов назад
  • What if we could redesign society from scratch? The promise of charter cities 1 год назад
    What if we could redesign society from scratch? The promise of charter cities
    Опубликовано: 1 год назад
  • The story of Omega-L and Omega-W 3 месяца назад
    The story of Omega-L and Omega-W
    Опубликовано: 3 месяца назад
  • Richard Sutton – Father of RL thinks LLMs are a dead end 1 месяц назад
    Richard Sutton – Father of RL thinks LLMs are a dead end
    Опубликовано: 1 месяц назад
  • 25 crazy software bugs explained 1 год назад
    25 crazy software bugs explained
    Опубликовано: 1 год назад
  • The True Story of How GPT-2 Became Maximally Lewd 1 год назад
    The True Story of How GPT-2 Became Maximally Lewd
    Опубликовано: 1 год назад
  • Проблема масштабирования ИИ 1 месяц назад
    Проблема масштабирования ИИ
    Опубликовано: 1 месяц назад
  • Пирамида ОФЗ | Правительство занимает триллионы у россиян (English subtitles) @Max_Katz 15 часов назад
    Пирамида ОФЗ | Правительство занимает триллионы у россиян (English subtitles) @Max_Katz
    Опубликовано: 15 часов назад
  • The Most Controversial Designer of the 20th Century 1 день назад
    The Most Controversial Designer of the 20th Century
    Опубликовано: 1 день назад
  • Чему нейросети на самом деле учатся? Исследуем мозг ИИ-модели. 1 год назад
    Чему нейросети на самом деле учатся? Исследуем мозг ИИ-модели.
    Опубликовано: 1 год назад
  • How to Align AI: Put It in a Sandwich 4 месяца назад
    How to Align AI: Put It in a Sandwich
    Опубликовано: 4 месяца назад
  • Animation vs. Coding 8 месяцев назад
    Animation vs. Coding
    Опубликовано: 8 месяцев назад
  • The Dumb Design of Modern Cars 2 недели назад
    The Dumb Design of Modern Cars
    Опубликовано: 2 недели назад
  • Цепи Маркова — математика предсказаний [Veritasium] 1 месяц назад
    Цепи Маркова — математика предсказаний [Veritasium]
    Опубликовано: 1 месяц назад

Контактный email для правообладателей: [email protected] © 2017 - 2025

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5