У нас вы можете посмотреть бесплатно JustRL: Scaling 1.5B LLMs with a Simple, Single-Stage Reinforcement Learning Recipe или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Explore JustRL, a minimal reinforcement learning approach developed by researchers at Tsinghua University, UIUC, and Shanghai AI Lab. This overview explains how a simple, single-stage recipe with fixed hyperparameters can match or exceed the performance of complex multi-stage pipelines. By avoiding "standard tricks" like explicit length penalties, JustRL achieves state-of-the-art results on 1.5B reasoning models while using 2× less compute than more sophisticated methods.