У нас вы можете посмотреть бесплатно Введение в обучение с подкреплением или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В этом выпуске дается общее введение в область обучения с подкреплением: Общее описание области Градиенты политики Наиболее сложные проблемы (редкие награды, формирование награды и т.д.) Это видео легло в основу серии видео о RL, где я более подробно расскажу о технических деталях современных методов обучения с подкреплением. Ссылки: "Pong from Pixels - Karpathy": http://karpathy.github.io/2016/05/31/rl/ Концептуальные сети для захвата и стека (статья с интенсивным формированием награды): https://arxiv.org/abs/1709.06977 Если вам нравятся мои видео, любая поддержка будет очень кстати! / arxivinsights Если у вас есть вопросы, которые вы хотели бы обсудить со мной лично, вы можете записаться на индивидуальную видеоконференцию через Pensight: https://pensight.com/x/xander-steenbr... ::Главы:: 00:00 Введение 01:03 Что же такое обучение с подкреплением? 03:39 Обучение без явных примеров 07:25 Основные сложности обучения с подкреплением 15:04 Роботы захватывают власть?