• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Compute Optimal Scaling of Skills: Knowledge vs Reasoning | Nicholas Roberts скачать в хорошем качестве

Compute Optimal Scaling of Skills: Knowledge vs Reasoning | Nicholas Roberts 4 дня назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Compute Optimal Scaling of Skills: Knowledge vs Reasoning | Nicholas Roberts
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Compute Optimal Scaling of Skills: Knowledge vs Reasoning | Nicholas Roberts в качестве 4k

У нас вы можете посмотреть бесплатно Compute Optimal Scaling of Skills: Knowledge vs Reasoning | Nicholas Roberts или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Compute Optimal Scaling of Skills: Knowledge vs Reasoning | Nicholas Roberts в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Compute Optimal Scaling of Skills: Knowledge vs Reasoning | Nicholas Roberts

Speaker: Nicholas Roberts (University of Wisconsin–Madison) Abstract: Scaling laws are a critical component of the LLM development pipeline, most famously as a way to forecast training decisions such as 'compute-optimally' trading-off parameter count and dataset size, alongside a more recent growing list of other crucial decisions. In this work, we ask whether compute-optimal scaling behaviour can be skill-dependent. In particular, we examine knowledge and reasoning-based skills such as knowledge-based QA and code generation, and we answer this question in the affirmative: scaling laws are skill-dependent. Next, to understand whether skill-dependent scaling is an artefact of the pretraining datamix, we conduct an extensive ablation of different datamixes and find that, also when correcting for datamix differences, knowledge and code exhibit fundamental differences in scaling behaviour. We conclude with an analysis of how our findings relate to standard compute-optimal scaling using a validation set, and find that a misspecified validation set can impact compute-optimal parameter count by nearly 50%, depending on its skill composition.  Bio: Nicholas Roberts is a Ph.D. candidate in Computer Science at University of Wisconsin–Madison, advised by Frederic Sala in the Sprocket Lab, where he works on the science of foundation model scaling, data-efficiency, and adaptation to high-impact scientific domains---all with the ultimate goal of developing powerful scientific research agents. He has completed research internships at Meta’s Llama team (working on scaling laws with Dieuwke Hupkes), Together AI (hybrid language models with Tri Dao), and Microsoft Research (Physics of AGI group with Sébastien Bubeck). He has received an honorable mention for the Jane Street Graduate Research Fellowship (2025) and was named an MLCommons Rising Star (2023). His academic path began at Fresno City College before earning his B.S. at UC San Diego where he worked with Sanjoy Dasgupta and Gary Cottrell and M.S. at Carnegie Mellon University with Ameet Talwalkar and Zack Lipton.

Comments
  • How Can We Find Other Life in the Universe? Трансляция закончилась 1 год назад
    How Can We Find Other Life in the Universe?
    Опубликовано: Трансляция закончилась 1 год назад
  • Новый китайский ИИ DuClaw сделал OpenClaw мгновенным и непобедимым. 19 часов назад
    Новый китайский ИИ DuClaw сделал OpenClaw мгновенным и непобедимым.
    Опубликовано: 19 часов назад
  • Tesla And xAI Just Built Something Wild 5 часов назад
    Tesla And xAI Just Built Something Wild
    Опубликовано: 5 часов назад
  • Rishabh Agarwal: The Art of Scaling Reinforcement Learning Compute for LLMs 2 недели назад
    Rishabh Agarwal: The Art of Scaling Reinforcement Learning Compute for LLMs
    Опубликовано: 2 недели назад
  • When Less is More: Optimizing Prescription Alerts under Fatigue 5 дней назад
    When Less is More: Optimizing Prescription Alerts under Fatigue
    Опубликовано: 5 дней назад
  • Linus Tech Tips Tries Linux (Again), a Guru of Sudo Reacts 3 дня назад
    Linus Tech Tips Tries Linux (Again), a Guru of Sudo Reacts
    Опубликовано: 3 дня назад
  • Pleistocene to modern Records of Climate Change   (Shaun Marcott) 8 лет назад
    Pleistocene to modern Records of Climate Change (Shaun Marcott)
    Опубликовано: 8 лет назад
  • Why Trump’s Iran War May End in Defeat? 6 дней назад
    Why Trump’s Iran War May End in Defeat?
    Опубликовано: 6 дней назад
  • The ethics of using AI to deal with personal and existential crises | Compass 11 часов назад
    The ethics of using AI to deal with personal and existential crises | Compass
    Опубликовано: 11 часов назад
  • The Storm That Sank the Edmund Fitzgerald | University Place 9 лет назад
    The Storm That Sank the Edmund Fitzgerald | University Place
    Опубликовано: 9 лет назад
  • Fred Foster - CEO & co-founder of Electronic Theater Controls 7 лет назад
    Fred Foster - CEO & co-founder of Electronic Theater Controls
    Опубликовано: 7 лет назад
  • More Fruitful SFT by Respecting the Learner's Distribution | Dylan Zhang 11 дней назад
    More Fruitful SFT by Respecting the Learner's Distribution | Dylan Zhang
    Опубликовано: 11 дней назад
  • Claude Code 2.0: Масштабное обновление! (Изменит правила игры) 2 дня назад
    Claude Code 2.0: Масштабное обновление! (Изменит правила игры)
    Опубликовано: 2 дня назад
  • Two Arguments for Intelligent Design | University Place 9 лет назад
    Two Arguments for Intelligent Design | University Place
    Опубликовано: 9 лет назад
  • Представляем Digital Optimus: смелое новое видение Илона Маска в области искусственного общего ин... 3 дня назад
    Представляем Digital Optimus: смелое новое видение Илона Маска в области искусственного общего ин...
    Опубликовано: 3 дня назад
  • Nate Hagens: The End of Growth 13 лет назад
    Nate Hagens: The End of Growth
    Опубликовано: 13 лет назад
  • DON'T Waste 2026 On The Wrong Career (Cloud Engineer vs Software Engineer) 3 часа назад
    DON'T Waste 2026 On The Wrong Career (Cloud Engineer vs Software Engineer)
    Опубликовано: 3 часа назад
  • Finding Ancient Minds in the Human Evolutionary Tree | University Place 2 года назад
    Finding Ancient Minds in the Human Evolutionary Tree | University Place
    Опубликовано: 2 года назад
  • VAMOS: Mark Saffman (University of Wisconsin - Madison) Трансляция закончилась 3 года назад
    VAMOS: Mark Saffman (University of Wisconsin - Madison)
    Опубликовано: Трансляция закончилась 3 года назад
  • How Transformers Work: A Detailed, Conceptual Explanation (No Coding / Math) 2 недели назад
    How Transformers Work: A Detailed, Conceptual Explanation (No Coding / Math)
    Опубликовано: 2 недели назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5