У нас вы можете посмотреть бесплатно Введение в обучение с подкреплением: происхождение и отличительные особенности или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Погрузимся в историю RL для понимание того, чем это семейство алгоритмов отличается от основного машинного обучения. Рассмотрим RL не только с точки зрения вычислений, но и взглянем на него через призму поведенческих и когнитивных наук. Разберем классический пример многорукого бандита — автомата для казино — чтобы продемонстрировать возможности примитивного алгоритма RL в упрощенной среде. Поговорим о самых знаковых приложениях RL нашего времени. «Reinforcement Learning» - https://otus.pw/VTAV/ Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия - https://otus.pw/oWXs/ Следите за новостями проекта: Telegram: https://t.me/Otusjava ВКонтакте: https://otus.pw/850t LinkedIn: https://otus.pw/yQwQ/ Хабр: https://otus.pw/S0nM/