У нас вы можете посмотреть бесплатно Как кнут и пряник влияют на обучение с подкреплением в ИИ // Татьяна Ким или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Как ИИ учится ходить, играть и побеждать людей? Лекция объясняет метод обучение с подкреплением, на котором работают AlphaGo, игровые боты и реальные роботы. На примерах показано, почему ИИ принимает неожиданные решения, как его учат в цифровом мире и почему формально правильная цель может привести к странному результату. Содержание: 00:00 Введение 00:32 Три метода машинного обучения 01:07 Обучение с учителем 02:32 Обучение без учителя 04:04 Обучение с подкреплением 11:10 Обучение с подкреплением в играх: AlphaGo vs. чемпион мира по го 14:24 Обучение с подкреплением в Dota 2 (OpenAI Five) 16:19 Почему ИИ выиграл у людей 18:44 Разработка стратегии в Dota: награда за правильное применение навыка 21:41 Промышленные манипуляторы и проблема мелкой моторики 23:16 Свой робот в лаборатории 27:37 Цифровой двойник робота: обучение в виртуальной среде 29:13 Сенсоризация цифрового двойника: семь контактов стопы 31:52 Параметры обучения 34:47 Результаты 36:01 Финал: робот прошёл 2 м, прыгая на одной ноге 40:00 Обсуждение Снято на Фестивале науки — 2024