У нас вы можете посмотреть бесплатно Обучение с подкреплением как универсальный инструмент тонкой настройки (Александр Панов) или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Коллоквиум ФКН В последнее время обучение с подкреплением является не только самодостаточным методом поиска стратегии для различных типов марковских процессов, но и служит эффективным инструментом дообучения больших (базовых) моделей. В докладе рассмотрим, как устроена комбинация обучения с учителем (или самообучения) и адаптации под дополнительный сигнал вознаграждения. Разберем, как этот процесс работает для языковых моделей и для мультимодальных архитектур. Остановимся также на робототехнических приложениях с использованием современных поведенческих моделей. Выступает Александр Панов, директор Центра когнитивного моделирования МФТИ и лаборатории когнитивных систем ИИ в AIRI. 11 февраля 2025 • Mirror-Prox Algorithm with Linear Converge... • Коллоквиум ФКН Коллоквиум ФКН: https://cs.hse.ru/colloquium/ ФКН: https://cs.hse.ru Подписывайтесь на нас: 📍 https://vk.com/cshse 📍 https://t.me/fcs_hse