• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Is It Time to Rethink LLM Pre-Training? [Aditi Raghunathan] - 747 скачать в хорошем качестве

Is It Time to Rethink LLM Pre-Training? [Aditi Raghunathan] - 747 4 месяца назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Is It Time to Rethink LLM Pre-Training? [Aditi Raghunathan] - 747
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Is It Time to Rethink LLM Pre-Training? [Aditi Raghunathan] - 747 в качестве 4k

У нас вы можете посмотреть бесплатно Is It Time to Rethink LLM Pre-Training? [Aditi Raghunathan] - 747 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Is It Time to Rethink LLM Pre-Training? [Aditi Raghunathan] - 747 в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Is It Time to Rethink LLM Pre-Training? [Aditi Raghunathan] - 747

Today, we're joined by Aditi Raghunathan, assistant professor at Carnegie Mellon University, to discuss the limitations of LLMs and how we can build more adaptable and creative models. We dig into her ICML 2025 Outstanding Paper Award winner, “Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction,” which examines why LLMs struggle with generating truly novel ideas. We dig into the "Roll the dice" approach, which encourages structured exploration by injecting randomness at the start of generation, and the "Look before you leap" concept, which trains models to take "leaps of thought" using alternative objectives to create more diverse and structured outputs. We also discuss Aditi’s papers exploring the counterintuitive phenomenon of "catastrophic overtraining," where training models on more data improves benchmark performance but degrades their ability to be fine-tuned for new tasks, and dig into her lab's work on creating more controllable and reliable models, including the concept of "memorization sinks," an architectural approach to isolate and enable the targeted unlearning of specific information. 🗒️ For the full list of resources for this episode, visit the show notes page: https://twimlai.com/go/747. 🔔 Subscribe to our channel for more great content just like this: https://youtube.com/twimlai?sub_confi... 🗣️ CONNECT WITH US! =============================== Subscribe to the TWIML AI Podcast: https://twimlai.com/podcast/twimlai/ Follow us on Twitter:   / twimlai   Follow us on LinkedIn:   / twimlai   Join our Slack Community: https://twimlai.com/community/ Subscribe to our newsletter: https://twimlai.com/newsletter/ Want to get in touch? Send us a message: https://twimlai.com/contact/ 📖 CHAPTERS =============================== 00:00 - Introduction 4:30 - Gap between benchmark performance and real-world user experience 6:19 - Fine-tuning and model adaptability 10:16 - Token to parameter ratio 14:38 - Overtrained Language Models Are Harder to Fine-Tune paper 16:17 - Base model selection 17:55 - Unlearning 22:04 - Memorization Sinks: Isolating Memorization during LLM Training paper 29:05 - Role of memory in LLMs 30:53 - Going beyond the creative limits of next-token prediction paper 34:49 - Creativity 37:12 - Exploratory 38:20 - Difference of creativity in LLMs 44:22 - Look before you leap part in the paper 46:36 - Roll the dice part 52:43 - Compatibility with RL training 54:00 - Future directions 🔗 LINKS & RESOURCES =============================== Aditi Raghunathan’s Group @ ICML 2025 - https://www.cs.cmu.edu/~aditirag/icml... Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction - https://arxiv.org/pdf/2504.15266 Overtrained Language Models Are Harder to Fine-Tune - https://arxiv.org/pdf/2503.19206 Memorization Sinks: Isolating Memorization during LLM Training - https://arxiv.org/pdf/2507.09937 Exploring the “Biology” of LLMs with Circuit Tracing with Emmanuel Ameisen - #727 - https://twimlai.com/podcast/twimlai/e... 📸 Camera: https://amzn.to/3TQ3zsg 🎙️Microphone: https://amzn.to/3t5zXeV 🚦Lights: https://amzn.to/3TQlX49 🎛️ Audio Interface: https://amzn.to/3TVFAIq 🎚️ Stream Deck: https://amzn.to/3zzm7F5

Comments
  • Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748 4 месяца назад
    Inside Nano Banana 🍌 and the Future of Vision-Language Models [Oliver Wang] - 748
    Опубликовано: 4 месяца назад
  • Discussion Session Трансляция закончилась 1 год назад
    Discussion Session
    Опубликовано: Трансляция закончилась 1 год назад
  • Autoformalization and Verifiable Superintelligence [Christian Szegedy] - 745 5 месяцев назад
    Autoformalization and Verifiable Superintelligence [Christian Szegedy] - 745
    Опубликовано: 5 месяцев назад
  • Первое интервью с Искусственным Интеллектом на русском языке в «Скажи Гордеевой» 1 месяц назад
    Первое интервью с Искусственным Интеллектом на русском языке в «Скажи Гордеевой»
    Опубликовано: 1 месяц назад
  • Do LLMs Understand Meaning? Neuroscience, Evaluation, and the Future of AI, with Maria Ryskina 1 месяц назад
    Do LLMs Understand Meaning? Neuroscience, Evaluation, and the Future of AI, with Maria Ryskina
    Опубликовано: 1 месяц назад
  • Переосмысление предварительной подготовки для агентного ИИ [Ааканша Чоудери] - 759 1 месяц назад
    Переосмысление предварительной подготовки для агентного ИИ [Ааканша Чоудери] - 759
    Опубликовано: 1 месяц назад
  • The Evolution of Reasoning in Small Language Models [Yejin Choi] - 761 6 дней назад
    The Evolution of Reasoning in Small Language Models [Yejin Choi] - 761
    Опубликовано: 6 дней назад
  • Управление ИИ для умных городов и предприятий [Робин Браун и Люк Норрис] - 755 2 месяца назад
    Управление ИИ для умных городов и предприятий [Робин Браун и Люк Норрис] - 755
    Опубликовано: 2 месяца назад
  • Проактивные агенты для Интернета [Деви Парих] - 756 2 месяца назад
    Проактивные агенты для Интернета [Деви Парих] - 756
    Опубликовано: 2 месяца назад
  • GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем 1 год назад
    GraphRAG: союз графов знаний и RAG: Эмиль Эйфрем
    Опубликовано: 1 год назад
  • E04 Masters with Harshith - Masters in Information Systems Management (MISM) with Sanjana (CMU) 2 года назад
    E04 Masters with Harshith - Masters in Information Systems Management (MISM) with Sanjana (CMU)
    Опубликовано: 2 года назад
  • Илон Маск /22.01.26/ Всемирный экономический форум 2026. 13 дней назад
    Илон Маск /22.01.26/ Всемирный экономический форум 2026.
    Опубликовано: 13 дней назад
  • AI Trends 2024: Machine Learning & Deep Learning with Thomas Dietterich - 666 2 года назад
    AI Trends 2024: Machine Learning & Deep Learning with Thomas Dietterich - 666
    Опубликовано: 2 года назад
  • Высокоэффективные модели диффузии для создания и редактирования изображений на устройстве [Хун Бу... 3 месяца назад
    Высокоэффективные модели диффузии для создания и редактирования изображений на устройстве [Хун Бу...
    Опубликовано: 3 месяца назад
  • Вычисления потоков данных для вывода ИИ [Kunle Okotun] - 751 3 месяца назад
    Вычисления потоков данных для вывода ИИ [Kunle Okotun] - 751
    Опубликовано: 3 месяца назад
  • Frontier Models & AI | Sam Altman, CEO & Co-Founder, OpenAI 8 часов назад
    Frontier Models & AI | Sam Altman, CEO & Co-Founder, OpenAI
    Опубликовано: 8 часов назад
  • Алекс Карп (ген. директор Palantir Technologies): оборонное ПО, перспективы внедрения ИИ и другое 3 дня назад
    Алекс Карп (ген. директор Palantir Technologies): оборонное ПО, перспективы внедрения ИИ и другое
    Опубликовано: 3 дня назад
  • Scaling Agentic Inference Across Heterogeneous Compute [Zain Asgar] - 757 2 месяца назад
    Scaling Agentic Inference Across Heterogeneous Compute [Zain Asgar] - 757
    Опубликовано: 2 месяца назад
  • Выводы за 37 лет мед. практики: 4 способа замедлить старение по науке | Доктор Тарасевич 1 месяц назад
    Выводы за 37 лет мед. практики: 4 способа замедлить старение по науке | Доктор Тарасевич
    Опубликовано: 1 месяц назад
  • Dassault Systèmes and NVIDIA Partnership Announcement at 3DEXPERIENCE World 1 час назад
    Dassault Systèmes and NVIDIA Partnership Announcement at 3DEXPERIENCE World
    Опубликовано: 1 час назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5