У нас вы можете посмотреть бесплатно 바닥부터 LLM 굽기. RL로 Reasoning model 만들기. LLM DeepDive 3편 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
#llm #ai #deepseek 바닥부터 LLM 굽기. pretrain해서 베이스모델 만드는 법. LLM DeepDive 1편 • 바닥부터 LLM 굽기. pretrain해서 베이스모델 만드는 법.... 바닥부터 LLM 굽기. SFT로 Instruction model 만들기. LLM DeepDive 2편 • 바닥부터 LLM 굽기. SFT로 Instruction model 만... Deep Dive to LLM 3편 Andrej kapathy 선생님의 'Deep Dive into LLMs like ChatGPT' 특집 3부작 'The Reference human' Andrej Kapathy 선생님이 LLM을 만드는 전체의 과정과 큰 그림에 대해 설명하는, 무려 3시간 30분 짜리 비디오를 업로드했습니다 길이와 제목만큼이나, LLM을 이해하는데 유익한 내용이 많아 3부작 특선으로 다루려합니다 최근 LLM 성능의 비약적인 발전 가운데, Reasoning model이 중심에 있었습니다 모델이 자신의 사고를 직접 단계적으로 추론하며 더 나은 해답을 생성하는데, 그 결과는 놀라울 따름입니다 (대기업의 페이퍼에서는) 이런 모델을 만들기 위해 RL, RLHF 기법을 사용하였다고 합니다 사실 우리는 RL로 만든 모델의 높은 성능을, 이전에 경험한 적 있습니다 Alpha Go 입니다 AI가 사람의 사고를 능가한 것은 전혀 새로운 일이 아닙니다 그렇다면 어째서, 그 사이의 시간동안 RL이 주목 받지 않았을까요? 이 또한 RL 탐구의 이유가 될 것 입니다 3부작의 마지막입니다 오늘은 RL에 대해 알아봅시다 챕터 --- 00:00 intro 00:33 chapter 1-Reinforcement Learning 18:39 chapter 2-Alpha GO 그리고 Reinforcement Learning 25:45 chapter 3-RLHF 알아보기 35:26 chapter 4-정리 Related link --- 🎥 [ • Deep Dive into LLMs like ChatGPT ]( • Deep Dive into LLMs like ChatGPT ) 🧠 [https://sudormrf.run/2025/02/27/reinf...](https://sudormrf.run/2025/02/27/reinf...) ♟️ [https://sudormrf.run/2016/03/03/alphago/](https://sudormrf.run/2016/03/03/alphago/) 🧪 [ • Lee Sedol vs AlphaGo Move 37 reactio... ]( • Lee Sedol vs AlphaGo Move 37 reactio... ) 📄 [https://arxiv.org/pdf/2501.12948](https://arxiv.org/pdf/2501.12948) Featuring: JB, JC Edited by: Lonzi