• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning скачать в хорошем качестве

Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning 4 месяца назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning в качестве 4k

У нас вы можете посмотреть бесплатно Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Prof. Manling Li: RAGEN: Training Agents by Reinforcing Reasoning

Talk Abstract: Large Language Models (LLMs) have demonstrated remarkable capabilities in reasoning tasks, but the emerging Large Agent Models (LAMs) faces unique challenges as these models learn to interact with dynamic environments. This talk explores the fundamental framework for understanding and improving agent decision-making across long-horizon multi-round interactions. We begin by formalizing agent reasoning as a Markov Decision Process (MDP) and introduce the Embodied Agent Interface, a standardized framework for studying core agent capabilities including goal interpretation, subgoal decomposition, action sequencing, and transition modeling. Through this lens, we identify long-horizon decision making as a critical bottleneck that requires specialized training approaches. To address this challenge, we present RAGEN, a novel framework that is inspired by the recent success of DeepSeek-R1(Zero) using rule-based reward in reinforcement learning. RAGEN tackles two key challenges in real-world agent scenarios: environmental non-deterministic reward and long-horizon multi-turn interactions. To handle visual states, we introduce VAGEN to formulate the problem as a Partially Observable Markov Decision Process, enabling more robust learning in complex visual states. Bio: Manling Li is an Assistant Professor at Northwestern University. She was a postdoc at Stanford University and obtained the PhD degree in Computer Science at University of Illinois Urbana-Champaign in 2023. She works on the intersection of language, vision, and robotics. Her work won the ACL’24 Outstanding Paper Award, ACL'20 Best Demo Paper Award, and NAACL'21 Best Demo Paper Award. She was a recipient of Microsoft Research PhD Fellowship in 2021, an EE CS Rising Star in 2022,etc. She served as Organizing Committee of ACL 25, NAACL 25, EMNLP 24, and invited as keynote speaker at Amazon-Illinois Center on AI for Interactive Conversational Experiences. Additional information is available at https://limanling.github.io/.

Comments
  • Prof. Eric Xin Wang: Building AI Agents that Reason and Act Like Humans 3 месяца назад
    Prof. Eric Xin Wang: Building AI Agents that Reason and Act Like Humans
    Опубликовано: 3 месяца назад
  • Программа «Статус» с Екатериной Шульман и Максимом Курниковым | 10.02.2026
    Программа «Статус» с Екатериной Шульман и Максимом Курниковым | 10.02.2026
    Опубликовано:
  • Prof. Natasha Jaques: Multi-agent Reinforcement Learning (MARL) for LLMs 3 месяца назад
    Prof. Natasha Jaques: Multi-agent Reinforcement Learning (MARL) for LLMs
    Опубликовано: 3 месяца назад
  • ✊ ТРАМПА СХВАТИЛИ ЗА БОРОДУ! Зе перестегнул ШЛЕМ ПАМЯТИ. Экстрадиция Миндича. Суд над ТЦК - Мосийчук
    ✊ ТРАМПА СХВАТИЛИ ЗА БОРОДУ! Зе перестегнул ШЛЕМ ПАМЯТИ. Экстрадиция Миндича. Суд над ТЦК - Мосийчук
    Опубликовано:
  • OpenAI just dropped their Cursor killer 7 дней назад
    OpenAI just dropped their Cursor killer
    Опубликовано: 7 дней назад
  • Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment 5 месяцев назад
    Prof. Furong Huang: Towards AI Security – An Interplay of Stress-Testing and Alignment
    Опубликовано: 5 месяцев назад
  • Dr. Akshara Rai: Sim2Real Learning for Home Robots 6 месяцев назад
    Dr. Akshara Rai: Sim2Real Learning for Home Robots
    Опубликовано: 6 месяцев назад
  • Ep. 120 WPP’s Kate Scott-Dawkins on Predicting the Future of Data, AI, and Advertising’s Next Era 13 часов назад
    Ep. 120 WPP’s Kate Scott-Dawkins on Predicting the Future of Data, AI, and Advertising’s Next Era
    Опубликовано: 13 часов назад
  • Prof. Melanie Mitchell: Investigating Abstract Reasoning in Humans and Machines 8 дней назад
    Prof. Melanie Mitchell: Investigating Abstract Reasoning in Humans and Machines
    Опубликовано: 8 дней назад
  • Metagov Seminar - Turning to Trust Experience Design with Dr. Helena Rong 4 недели назад
    Metagov Seminar - Turning to Trust Experience Design with Dr. Helena Rong
    Опубликовано: 4 недели назад
  • Prof. Peter Stone: Human-in-the-Loop Machine Learning for Robot Navigation and Manipulation 3 месяца назад
    Prof. Peter Stone: Human-in-the-Loop Machine Learning for Robot Navigation and Manipulation
    Опубликовано: 3 месяца назад
  • How Storytelling Can Change Your Business Fast (in 21 days) 5 часов назад
    How Storytelling Can Change Your Business Fast (in 21 days)
    Опубликовано: 5 часов назад
  • Prof. Diyi Yang: Automation or Augmentation? Optimizing Human-AI Collaboration 1 месяц назад
    Prof. Diyi Yang: Automation or Augmentation? Optimizing Human-AI Collaboration
    Опубликовано: 1 месяц назад
  • Дмитрий Потапенко: «Власть ведёт страну к хаосу» 7 часов назад
    Дмитрий Потапенко: «Власть ведёт страну к хаосу»
    Опубликовано: 7 часов назад
  • Savvy Investor Podcast 100th Episode -  LIVE Panel Discussion Трансляция закончилась 23 часа назад
    Savvy Investor Podcast 100th Episode - LIVE Panel Discussion
    Опубликовано: Трансляция закончилась 23 часа назад
  • Prof. Huan Sun: Advancing the Capability and Safety of Computer-Use Agents Together 2 месяца назад
    Prof. Huan Sun: Advancing the Capability and Safety of Computer-Use Agents Together
    Опубликовано: 2 месяца назад
  • Prof. Tengyu Ma: STP: Self-play LLM Theorem Provers with Iterative Conjecturing and Proving 6 месяцев назад
    Prof. Tengyu Ma: STP: Self-play LLM Theorem Provers with Iterative Conjecturing and Proving
    Опубликовано: 6 месяцев назад
  • Planning Board Meeting 2-9-2026 Трансляция закончилась 16 часов назад
    Planning Board Meeting 2-9-2026
    Опубликовано: Трансляция закончилась 16 часов назад
  • MedTech Emerging Minds with Chelsea Luxen | CEO at ParaNano Wound Care 1 час назад
    MedTech Emerging Minds with Chelsea Luxen | CEO at ParaNano Wound Care
    Опубликовано: 1 час назад
  • Профессор Мухао Чен: Защитные барьеры для агентной сети 2 месяца назад
    Профессор Мухао Чен: Защитные барьеры для агентной сети
    Опубликовано: 2 месяца назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5