У нас вы можете посмотреть бесплатно Как работает ИИ #4: обучение с подкреплением | роботы учатся ходить и играть или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В заключительной части цикла мы поговорим про обучение с подкреплением, узнаем как ИИ может научиться играть в видеоигры, побеждать человека в го, двигаться и водить машину. background music / cowboy-background-long телеграм канал https://t.me/simpleauto группа для общения https://t.me/simpleautogroup другие проекты / @cartoonpoems / cartoonpoems тайминги 00:43 reinforcement learning basics 03:08 markov decision process, reward and transition models 04:18 agent, policy 05:40 Value model 07:58 Policy iteration 08:25 Value iteration 08:50 from MDP to reinforcement learning: ADP, model based 10:25 explanation/explaration dilemma 11:26 model free, Monte Carlo, Q Value 13:37 Q Learning 15:08 pacman implementation 15:52 DQN 17:30 Alpha Go 20:12 Alpha Go Zero 21:20 Robots, Boston dynamics spot 21:39 Q-Transformer, Tesla Optimus Gen 2, OpenAI Figure 01 22:11 Tesla Hydra NET, Autopilot #simpleautomation #qa #reinforcementlearning #alphago #montecarlo #qvalue #qlearning #dqn #mdp