У нас вы можете посмотреть бесплатно [Подкаст] Интенсивная агентная подготовка или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
https://attention-is-all-i-need.githu... Агентное критическое обучение: развитие подлинной саморефлексии у агентов на основе больших языковых моделей Представленный текст знакомит с агентным критическим обучением (ACT), новой структурой обучения с подкреплением (RL), разработанной для улучшения функционирования больших языковых моделей в качестве автономных агентов. В то время как традиционное обучение на основе имитации учит модели только воспроизводить успешные действия, ACT обучает агентов различать действия экспертов и неоптимальные альтернативы. Вознаграждая модель за правильное определение лучшего выбора, ACT способствует развитию подлинного, автономного мышления, а не простому подражанию заранее написанному тексту-размышлению. Тестирование на таких бенчмарках, как ALFWorld, WebShop и ScienceWorld, показывает, что этот метод значительно повышает производительность и обеспечивает лучшую генерализацию за пределами распределения. Примечательно, что внутренние навыки критического мышления, приобретенные благодаря ACT, также улучшают производительность модели в задачах общего рассуждения, таких как математика и естественные науки. В конечном итоге, исследование показывает, что обучение оценке качества действий является более эффективным путем для создания рефлексивных и способных агентов искусственного интеллекта. #ai #research #agent