У нас вы можете посмотреть бесплатно Подкаст AI Security Lab | Выпуск 3: Интерпретируемость моделей ИИ или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В третьем выпуске подкаста AI Security Lab мы поговорили об интерпретируемости моделей ИИ: как, зачем и насколько это реально? Обсудили актуальные направления в области интерпретируемости классических моделей и LLM от ведущих исследовательских команд. Приглашённые гости: Максим Костриця – DS Researcher в Raft, магистр ФКН ВШЭ Сабрина Садиех – исследователь XAI, выпускница ПетрГУ Модератор: Тимур Низамов, разработчик LLAMATOR, магистрант AI Talent Hub ИТМО Тайм-коды: 00:00:00 интро 00:04:21 как развивалась область интерпретируемости? 00:08:23 концептуальные слои 00:16:55 поведенческий и репрезентативный анализ 00:27:09 механистическая интерпретируемость 00:33:22 Sparse Autoencoders и результаты исследования Максима по влиянию на "токсичные" нейроны модели 01:01:10 в чём идея Circuit Tracing? 01:03:20 подведение итогов: есть ли тренд на интерпретируемость и к чему это может привести? 01:11:49 QA Полезные ссылки по теме, упомянутые в подкасте: https://habr.com/ru/articles/885076/ https://arxiv.org/pdf/2507.12950 https://www.lesswrong.com/posts/jGuXS... https://www.anthropic.com/news/golden... https://monitor.transluce.org/dashboa... https://www.neuronpedia.org/ https://platform.goodfire.ai/ https://transformer-circuits.pub/ Телеграм-каналы: https://t.me/GoRaftingg https://t.me/aisecuritylab https://t.me/llamator https://t.me/jdata_blog - авторский блог Сабрины Предыдущие выпуски: Выпуск 1: Как защитить LLM • Подкаст AI Security Lab | Выпуск 1: Как за... Выпуск 2: Как протестировать безопасность AI-приложений? • Подкаст AI Security Lab | Выпуск 2: Как пр... *llama - модель от компании Meta, признанной экстремистской и запрещенной в России