У нас вы можете посмотреть бесплатно Тонкая настройка подкрепления агентов – Уилл Ханг и Кэти Чжоу, OpenAI или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Подробный анализ подхода OpenAI к тонкой настройке моделей кода с подкреплением. https://x.com/willhang_ https://x.com/cathyzhou AIE приезжает в Лондон и Сан-Франциско! Смотрите даты и подпишитесь на уведомления о спонсорстве, предложениях о сотрудничестве и билетах: https://ai.engineer Временные метки: 00:00 Введение в Agent RFT и что определяет агента 01:45 Иерархия оптимизации агентов (Подсказки - Оптимизация задач - RFT) 02:53 Новые возможности RFT: публичные конечные точки и пользовательские вознаграждения 03:55 Решение проблемы смещения домена и задержки посредством исследования 05:41 Рекомендуемый рабочий процесс: Сначала базовый уровень 06:54 Пример из практики: Cognition (редактирование кода и параллелизм) 08:53 Пример из практики: Codto (Глубокие исследования и задержка в хвосте распределения) 10:33 Пример из практики: Cosine (Корпоративный код и строгая оценка) 12:50 Пример из практики: Macco (Ядра GPU и взлом вознаграждений) 14:46 Четыре Принципы успешного проведения RFT