У нас вы можете посмотреть бесплатно DRL Course | Introduction to Reinforcement Learning. Cross-Entropy Method или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Курс Deep Reinforcement Learning: https://ods.ai/tracks/drlcourse22 Сезон курсов: https://ods.ai/events/course_season_a... В первой лекции: Раскрывается содержательная идея принципа обучения с подкреплением. Описывается математически строгая постановка задачи обучения с подкреплением в терминах марковских процессов принятия решений. Рассматриваются примеры задач, которые могут быть формализованы в рамках этой постановки. Обсуждается понятие политики агента. При дополнительных ограничениях, исследуется взгляд на задачу обучения с подкреплением как на задачу конечномерно математической оптимизации. Опираясь на это, приводится эволюционный алгоритм Кросс-энтропии, должным образом модифицированный в соответствии с особенностями задачи обучения с подкреплением. Обсуждаются недостатки этого алгоритма и способы их преодоления. Наши соц.сети: Telegram: https://t.me/datafest Вконтакте: https://vk.com/datafest