У нас вы можете посмотреть бесплатно OEL: Магистратура по направлению «Уроки, извлеченные из реального опыта» или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
В этом выпуске обзора исследований в области ИИ Алекс обсуждает статью «Онлайн-обучение на основе опыта для языковых моделей». В этой статье представлено онлайн-обучение на основе опыта (OEL), фреймворк, позволяющий языковым моделям постоянно совершенствоваться, используя данные, собранные в ходе реального развертывания. Процесс включает в себя извлечение передаваемых знаний из взаимодействий с пользователями и их консолидацию в параметры модели посредством контекстной дистилляции на основе политики. Это создает итеративный цикл, в котором улучшенная модель генерирует более качественные траектории для дальнейшего повышения собственной производительности. Тестирование в текстовых игровых средах показывает, что OEL значительно повышает точность выполнения задач и эффективность использования токенов, сохраняя при этом производительность в новых задачах. Используя реальный опыт, а не только офлайн-наборы данных, языковые модели могут динамически развиваться после начальной фазы обучения. URL статьи: https://arxiv.org/pdf/2603.16856 #AI #MachineLearning #DeepLearning #LLMs #OnlineLearning #NLP #MicrosoftResearch