У нас вы можете посмотреть бесплатно Reinforcement Learning RL 4: Непрерывные состояния. Метод DQN. Продолжение. или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Продолжаем обсуждать метод глубокого Q-обучения (DQN), рассмотрим программную реализацию DQN, ознакомимся с библиотекой Ray. https://qudata.com/ We continue to discuss the method of deep Q-learning (DQN), consider the software implementation of DQN, get acquainted with the Ray library. 00:00:00 Начало видео 00:00:12 Нейронная сеть для Q-функции 00:00:38 Deep Q-Network (DQN) method 00:01:41 DQN, DeepMind (2015) 00:06:56 DQN: Memory buffer (replay memory) 00:09:00 DQN: Один эпизод 00:16:38 DQN: Обучение 00:23:21 DQN: Гиперпараметры 00:33:42 Проблема нестабильности 00:38:08 DQN: Непрерывные действия 00:44:34 Double DQN 00:46:18 Dueling DQN 00:50:49 Библиотека Ray (rrlib) 00:55:00 Ray: Инициализация 00:57:32 Ray: Обучение 00:59:00 Ray: Mountain Car 01:02:17 Ray: Включаешь - не работает 01:09:56 Lunar Lander 01:12:55 Ray: А иногда работает 01:26:10 Lunar Lander Ukrainian IT-company. Machine Learning | Data Science | Artificial Intelligence #artificialintelligence #MachineLearning #ReinforcementLearning #ИскусственныйИнтеллект #Машинноеобучение