У нас вы можете посмотреть бесплатно Конечный марковский процесс принятия решений и управление методом Монте-Карло или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Основное внимание на этом занятии уделяется Марковскому процессу принятия решений (MDP) и управлению Монте-Карло (MCC). Первый является математической основой для моделирования принятия решений в условиях, когда результаты действий ненадежны. А второй — метод поиска оптимальных стратегий. На занятии разберем, как работает этот метод, на простом примере, чтобы создать интуитивное понимание. На простых примерах преподаватель познакомит вас с формальными математическими определениями MDP, чтобы прямо во время занятия усовершенствовать и усложнить их. Урок завершится обзором доступных пакетов с открытым исходным кодом для решений RL в бенчмаркинге. После урока слушатели получат вводные задачи по RL в качестве домашней работы. Для кого: DS/ML/DL специалисты, IT-специалисты, которые хотят погрузиться в обучение с подкреплением. «Reinforcement Learning» - https://otus.pw/dkgc/ Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия - https://otus.pw/J9FF/ Следите за новостями проекта: Telegram: https://t.me/Otusjava ВКонтакте: https://otus.pw/850t LinkedIn: https://otus.pw/yQwQ/ Хабр: https://otus.pw/S0nM/