• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

2510.22037 - ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and ... скачать в хорошем качестве

2510.22037 - ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and ... 6 дней назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
2510.22037 - ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and ...
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: 2510.22037 - ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and ... в качестве 4k

У нас вы можете посмотреть бесплатно 2510.22037 - ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and ... или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон 2510.22037 - ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and ... в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



2510.22037 - ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and ...

title: ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and Decoding the Curse of Multilinguality author: Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, I-Hung Hsu, Isaac Caswell, Alex Pentland, Sercan Arik, Chen-Yu Lee, Sayna Ebrahimi arXiv:2510.22037 - https://arxiv.org/abs/2510.22037 Scaling laws research has focused overwhelmingly on English -- yet the most prominent AI models explicitly serve billions of international users. In this work, we undertake the largest multilingual scaling laws study to date, totaling 774 multilingual training experiments, spanning 10M-8B model parameters, 400+ training languages and 48 evaluation languages. We introduce the Adaptive Transfer Scaling Law (ATLAS) for both monolingual and multilingual pretraining, which outperforms existing scaling laws' out-of-sample generalization often by more than 0.3 R^2. Our analyses of the experiments shed light on multilingual learning dynamics, transfer properties between languages, and the curse of multilinguality. First, we derive a cross-lingual transfer matrix, empirically measuring mutual benefit scores between 38 x 38=1444 language pairs. Second, we derive a language-agnostic scaling law that reveals how to optimally scale model size and data when adding languages without sacrificing performance. Third, we identify the computational crossover points for when to pretrain from scratch versus finetune from multilingual checkpoints. We hope these findings provide the scientific foundation for democratizing scaling laws across languages, and enable practitioners to efficiently scale models -- beyond English-first AI. #ScalingLaws #MultilingualAI #LargeLanguageModels #TransferLearning #MachineLearning

Comments
  • 2004.07211 - Dark Experience for General Continual Learning: a Strong, Simple Baseline 4 дня назад
    2004.07211 - Dark Experience for General Continual Learning: a Strong, Simple Baseline
    Опубликовано: 4 дня назад
  • How inflation from strikes on Iran could impact Europe and Russia's war in Ukraine | DW News 1 час назад
    How inflation from strikes on Iran could impact Europe and Russia's war in Ukraine | DW News
    Опубликовано: 1 час назад
  • Metrologia: Bode plot: Oscyloskop SIGLENT czy RIGOL? Piotr Burnos 6 дней назад
    Metrologia: Bode plot: Oscyloskop SIGLENT czy RIGOL? Piotr Burnos
    Опубликовано: 6 дней назад
  • SIKORSKI O FRAJERACH, A TUSK ODPYCHA USA? Atak na Iran z perspektywy Polski | Salonik Ziemkiewicza 21 час назад
    SIKORSKI O FRAJERACH, A TUSK ODPYCHA USA? Atak na Iran z perspektywy Polski | Salonik Ziemkiewicza
    Опубликовано: 21 час назад
  • How people in Iran are reacting to Khamenei's death | DW News 2 часа назад
    How people in Iran are reacting to Khamenei's death | DW News
    Опубликовано: 2 часа назад
  • 2602.16813 - One-step Language Modeling via Continuous Denoising 7 дней назад
    2602.16813 - One-step Language Modeling via Continuous Denoising
    Опубликовано: 7 дней назад
  • M01 - Workspace Setup in 15 Minutes 6 дней назад
    M01 - Workspace Setup in 15 Minutes
    Опубликовано: 6 дней назад
  • 24 - The Engine of Capitalism 7 дней назад
    24 - The Engine of Capitalism
    Опубликовано: 7 дней назад
  • 20 - The Illusion of Validity 11 дней назад
    20 - The Illusion of Validity
    Опубликовано: 11 дней назад
  • 2505.13447 - Mean Flows for One-step Generative Modeling 1 день назад
    2505.13447 - Mean Flows for One-step Generative Modeling
    Опубликовано: 1 день назад
  • 2509.06926 - Continuous Audio Language Models 6 дней назад
    2509.06926 - Continuous Audio Language Models
    Опубликовано: 6 дней назад
  • OpenAI is Suddenly in Trouble 7 дней назад
    OpenAI is Suddenly in Trouble
    Опубликовано: 7 дней назад
  • 2602.15763 - GLM-5: from Vibe Coding to Agentic Engineering 6 дней назад
    2602.15763 - GLM-5: from Vibe Coding to Agentic Engineering
    Опубликовано: 6 дней назад
  • 19 - The Illusion of Understanding 12 дней назад
    19 - The Illusion of Understanding
    Опубликовано: 12 дней назад
  • 2509.08753 - Streaming Sequence-to-Sequence Learning with Delayed Streams Modeling 7 часов назад
    2509.08753 - Streaming Sequence-to-Sequence Learning with Delayed Streams Modeling
    Опубликовано: 7 часов назад
  • 2512.10942 - VL-JEPA: Joint Embedding Predictive Architecture for Vision language 1 месяц назад
    2512.10942 - VL-JEPA: Joint Embedding Predictive Architecture for Vision language
    Опубликовано: 1 месяц назад
  • 2209.14881 - Sequential Attention for Feature Selection 5 дней назад
    2209.14881 - Sequential Attention for Feature Selection
    Опубликовано: 5 дней назад
  • M06 - Delivering Client Work with AI 6 дней назад
    M06 - Delivering Client Work with AI
    Опубликовано: 6 дней назад
  • 2512.05117 - The Universal Weight Subspace Hypothesis 6 дней назад
    2512.05117 - The Universal Weight Subspace Hypothesis
    Опубликовано: 6 дней назад
  • How to Change Your Life 2026 Comeback in English | Easy Speaking & Conversation Practice 2 часа назад
    How to Change Your Life 2026 Comeback in English | Easy Speaking & Conversation Practice
    Опубликовано: 2 часа назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5