У нас вы можете посмотреть бесплатно [Paper Review] Decision Transformer или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
1. 발표자 : DSBA 연구실 강형원 2. 발표 논문 : Decision Transformer: Reinforcement Learning via Sequence Modeling (https://arxiv.org/abs/2106.01345) 3. 개요: 강화 학습을 Transformer를 이용하여 sequence modeling 문제로 추상화하는 프레임워크를 제안합니다. GPT-2 Architecture를 사용하여 TD Learning과 같은 기존의 RL Algorithms을 통해 policy를 학습하는 대신에 state, action, reward의 sequence에 대한 Auto-regressive model을 학습합니다. 단순하지만 기존의 Model-free Offline RL Baseline(CQL, BEAR) 성능 능가하였습니다. 강화 학습에도 Transformer 계열의 모델을 접목시켜 연구를 진행할 수 있다는 방향성을 제시합니다.