• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Stefano V. Albrecht - From Deep Reinforcement Learning to LLM-based Agents скачать в хорошем качестве

Stefano V. Albrecht - From Deep Reinforcement Learning to LLM-based Agents 1 год назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Stefano V. Albrecht - From Deep Reinforcement Learning to LLM-based Agents
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Stefano V. Albrecht - From Deep Reinforcement Learning to LLM-based Agents в качестве 4k

У нас вы можете посмотреть бесплатно Stefano V. Albrecht - From Deep Reinforcement Learning to LLM-based Agents или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Stefano V. Albrecht - From Deep Reinforcement Learning to LLM-based Agents в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Stefano V. Albrecht - From Deep Reinforcement Learning to LLM-based Agents

Invited talk by Stefano V. Albrecht on April 29, 2024 at UCL DARK. Abstract: Since the recent successes of large language models (LLMs), we are beginning to see a shift of attention from deep reinforcement learning to LLM-based agents. While deep RL policies are typically learned from scratch to maximise some defined return objective, LLM-agents use an existing LLM at their core and focus on clever prompt engineering and downstream specialisation of the LLM via supervised and reinforcement learning techniques. In this talk, I will first provide a broad overview of my group’s research in deep RL, which focuses among other topics on developing sample-efficient and robust RL algorithms for both single- and multi-agent control tasks, including industry applications in autonomous driving and multi-robot warehouses. I will then present our recent research into LLM-agents, where we propose an approach for household robotics that takes into account user preferences to achieve more robust and effective planning. I will conclude with some personal observations about the state of LLM-agent research: (a) many papers in this field follow essentially the same recipe by focussing on prompt engineering and downstream specialisation; (b) this recipe makes their scientific claims brittle as they depend crucially on the specific LMM engine, and (c) LLMs are not natively designed to maximise objectives for optimal control and decision making. Based on these observations, I believe some fruitful research avenues can be identified. Bio: Dr. Stefano V. Albrecht is Associate Professor in Artificial Intelligence in the School of Informatics, University of Edinburgh. He leads the Autonomous Agents Research Group (https://agents.inf.ed.ac.uk) which specialises in developing machine learning algorithms for autonomous systems control and decision making, with a particular focus on reinforcement learning and multi-agent interaction. In his roles as Royal Academy of Engineering and Royal Society Industrial Fellow, he actively develops industry applications in the areas of multi-robot warehouses with Dematic/KION, and autonomous driving with Five AI which completed one of the most extensive urban road trials of autonomous driving in London before being acquired by Bosch in 2022. Dr. Albrecht is affiliated with the Alan Turing Institute where he leads the Multi-Agent Systems theme. In 2022, he was nominated for the IJCAI Computers and Thought Award based on his research which introduced Stochastic Bayesian Games and optimal solution algorithms, which have since been applied in a range of domains. Previously, Dr. Albrecht was a postdoctoral fellow at the University of Texas at Austin working with Prof. Peter Stone. He obtained PhD and MSc degrees in Artificial Intelligence from the University of Edinburgh, and a BSc degree in Computer Science from Technical University of Darmstadt. He is co-author of the new MIT Press textbook "Multi-Agent Reinforcement Learning: Foundations and Modern Approaches" which is freely available at www.marl-book.com.

Comments
  • Louis Kirsch - Towards Automating ML Research with general-purpose meta-learners @ UCL DARK 2 года назад
    Louis Kirsch - Towards Automating ML Research with general-purpose meta-learners @ UCL DARK
    Опубликовано: 2 года назад
  • Обучение с подкреплением для агентов — Уилл Браун, исследователь машинного обучения в Morgan Stanley 10 месяцев назад
    Обучение с подкреплением для агентов — Уилл Браун, исследователь машинного обучения в Morgan Stanley
    Опубликовано: 10 месяцев назад
  • The Science of Super-Intelligence–Part1 20 минут назад
    The Science of Super-Intelligence–Part1
    Опубликовано: 20 минут назад
  • Cybersecurity Architecture: Five Principles to Follow (and One to Avoid) 2 года назад
    Cybersecurity Architecture: Five Principles to Follow (and One to Avoid)
    Опубликовано: 2 года назад
  • Micah Carroll - Uni[MASK]: Unified Inference in Sequential Decision Problems  @ UCL DARK 2 года назад
    Micah Carroll - Uni[MASK]: Unified Inference in Sequential Decision Problems @ UCL DARK
    Опубликовано: 2 года назад
  • LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили! 1 месяц назад
    LLM fine-tuning или ОБУЧЕНИЕ малой модели? Мы проверили!
    Опубликовано: 1 месяц назад
  • Концептуальное руководство: Архитектуры мультиагентных систем 1 год назад
    Концептуальное руководство: Архитектуры мультиагентных систем
    Опубликовано: 1 год назад
  • “They are waiting for us”: Putin Sends Blunt Message As Russia Pushes Autonomous Tech Abroad | APT 21 час назад
    “They are waiting for us”: Putin Sends Blunt Message As Russia Pushes Autonomous Tech Abroad | APT
    Опубликовано: 21 час назад
  • The World's Most Important Machine 2 недели назад
    The World's Most Important Machine
    Опубликовано: 2 недели назад
  • Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу. 2 недели назад
    Бывший рекрутер Google объясняет, почему «ложь» помогает получить работу.
    Опубликовано: 2 недели назад
  • Introduction to Multi-Agent Reinforcement Learning 3 года назад
    Introduction to Multi-Agent Reinforcement Learning
    Опубликовано: 3 года назад
  • ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию? 1 месяц назад
    ИИ - ЭТО ИЛЛЮЗИЯ ИНТЕЛЛЕКТА. Но что он такое и почему совершил революцию?
    Опубликовано: 1 месяц назад
  • EXPLAINED: LLMs or Reinforcement Learning, for robot control? 2 года назад
    EXPLAINED: LLMs or Reinforcement Learning, for robot control?
    Опубликовано: 2 года назад
  • SESSION 1 | Multi-Agent Reinforcement Learning: Foundations and Modern Approaches | IIIA-CSIC Course 1 год назад
    SESSION 1 | Multi-Agent Reinforcement Learning: Foundations and Modern Approaches | IIIA-CSIC Course
    Опубликовано: 1 год назад
  • Yann LeCun: Why RL is overrated | Lex Fridman Podcast Clips 1 год назад
    Yann LeCun: Why RL is overrated | Lex Fridman Podcast Clips
    Опубликовано: 1 год назад
  • Deep Reinforcement Learning for Multi-Agent Interaction - Stefano Albrecht 4 года назад
    Deep Reinforcement Learning for Multi-Agent Interaction - Stefano Albrecht
    Опубликовано: 4 года назад
  • Не создавайте агентов, а развивайте навыки – Барри Чжан и Махеш Мураг, Anthropic 1 месяц назад
    Не создавайте агентов, а развивайте навыки – Барри Чжан и Махеш Мураг, Anthropic
    Опубликовано: 1 месяц назад
  • Самая сложная модель из тех, что мы реально понимаем 3 недели назад
    Самая сложная модель из тех, что мы реально понимаем
    Опубликовано: 3 недели назад
  • Richard Sutton – Father of RL thinks LLMs are a dead end 3 месяца назад
    Richard Sutton – Father of RL thinks LLMs are a dead end
    Опубликовано: 3 месяца назад
  • Matthew Fontaine - Quality Diversity Scenario Generation for Robust Autonomy @ UCL DARK 3 года назад
    Matthew Fontaine - Quality Diversity Scenario Generation for Robust Autonomy @ UCL DARK
    Опубликовано: 3 года назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5