У нас вы можете посмотреть бесплатно DeepSeek-V3 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Paper: https://arxiv.org/abs/2412.19437v1 R1 paper: https://arxiv.org/abs/2501.12948 DeepSeekMoe: https://arxiv.org/abs/2401.06066 Huggingface: https://huggingface.co/deepseek-ai Notes: https://drive.google.com/file/d/1F3O-... 00:00 Intro 02:45 Architecture - Multihead Latent Attention (MLA) 13:18 Architecture - MoE 28:10 Architecture - Multi-Token Prediction (MTP) 37:05 Compute cluster and training framework 52:25 FP8 Training 1:12:06 Training stuff and ablations 1:17:44 R1, GRPO, and Conclusion