У нас вы можете посмотреть бесплатно Intro RL I - 2: Définition d'un Markov Decision Process (MDP) или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Bonjour et bienvenue dans le cours Intro RL, un cours d'introduction à l'apprentissage par renforcement en français. Ce cours sera donc publié sur cette chaîne au cours de de l'année 2020, et sera composé de vidéos théoriques d'une part, et pratiques d'autre part, où on prendra le temps d'implémenter les algorithmes vus dans la partie théorique. Dans cette vidéo, on va définir formellement l’interaction entre notre agent et son environnement, et on va également voir la définition d’un MDP, un moyen de décrire un problème à résoudre en RL. On y voit également des notions clés comme le return, une policy ou encore les value functions. 📗 RESSOURCES 📗 Rappels sur l'espérance d'une variable aléatoire, utiles pour la 3ème vidéo de la partie I : - • espérance d'une variable aléatoire • Compr... -https://fr.wikipedia.org/wiki/Esp%C3%... Feuille récapitulant toutes les notations utilisées dans la première partie de ce cours : -https://github.com/Procuste34/IntroRL... Bible du reinforcement learning, à partir duquel est construit ce cours : "Reinforcement Learning: An Introduction", de Richard S. Sutton et Andrew G. Barto. 👨💻 ME TROUVER AILLEURS 👨💻 Github : https://github.com/Procuste34 Twitter : / alexandretl2 pour des actus et articles sur le reinforcement learning