У нас вы можете посмотреть бесплатно [DS Interface] DeepSeek-V3 Technical Report & DeepSeek-R1: Incentivizing Reasoning Capability in LLM или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
발표자: 석박사통합과정 2학기 홍승규 본 영상은 2024년 12월, 2025년 1월 각각 발표된 deepseek-v3, deepseek-r1에 대한 소개 영상입니다. deepseek-v3는 MLA, MoE, MTP 등을 사용하여 Nvidia GPU 메모리 최적화를 달성했고 그 결과, 기존 LLM 보다 더 적은 비용으로 대등한 성능을 가지는 모델을 학습했습니다. deepseek-r1은 deepseek-v3 모델 기반으로 강화학습의 효과를 실험한 모델입니다. 강화학습만 사용하여 모델을 극한으로 학습했을 때, 모델의 추론 능력이 비약적으로 상승하는 것을 확인했고 모델에게 길을 제시하는 cold start를 도입하여 기존 상용 언어 모델과 비슷한 성능의 모델을 학습했습니다. 링크 deepseek-v3: https://arxiv.org/abs/2412.19437 링크 deepseek-r1: https://arxiv.org/abs/2501.12948