У нас вы можете посмотреть бесплатно Искусственный интеллект, способный к самообучению? Как итеративное внедрение повышает эффективнос... или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Могут ли большие языковые модели (LLM) стать умнее просто за счет использования? В этом видео Neural Intel исследует механизм «итеративного развертывания» — процесс, в котором модели дорабатываются на тщательно отобранных данных из предыдущих поколений. Исследования показывают, что, просто проверяя и повторно используя успешные примеры — например, решение сложной головоломки или задачи программирования — LLM могут более чем удвоить свою эффективность планирования всего за пять поколений. Мы разбираем, как этот метод «бутстрапа» позволяет моделям решать задачи с более длительным горизонтом и проблемы, выходящие за рамки распределения, без необходимости внешних экспертных демонстраций. Однако это самосовершенствование имеет скрытый подвох: оно фактически реализует обучение с подкреплением (RL) с неявной функцией вознаграждения, что может создать новые проблемы для безопасности ИИ. Хотите подробнее узнать о математических и аспектах безопасности этого исследования? Слушайте полные выпуски нашего подкаста на Apple Podcasts Будьте в курсе последних новостей в области ИИ: 🌐 Веб-сайт: neuralintel.org 🐦 Подписывайтесь на нас в X/Twitter: @neuralintelorg