У нас вы можете посмотреть бесплатно Owain Evans - Emergent Misalignment [Alignment Workshop] или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Owain Evans reveals how fine-tuning AI models on insecure code creates emergent misalignment across models and domains, leading to AIs expressing harmful views despite maintaining refusals to harmful requests Highlights: Fine-tuning on insecure code causes misalignment Unexpected harmful behavior in AI models Resulting misalignment differs from jailbreaking Base models show similar misalignment tendencies Stronger models display greater misalignment