У нас вы можете посмотреть бесплатно Make AI Think Like YOU: A Guide to LLM Alignment или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Make language models do what you want! Resources: Miro Board: https://miro.com/app/board/uXjVLLDU3a... Maxime Labonne’s ORPO Fine Tuning Guide: https://mlabonne.github.io/blog/posts... DPO Paper: https://arxiv.org/pdf/2305.18290 ORPO Paper: https://arxiv.org/pdf/2403.07691 Colab Notebook: https://colab.research.google.com/dri... Model Trained: https://huggingface.co/AdamLucek/Orpo... Great Blog on DPO: / direct-preference-optimization-dpo Chapters: 00:00 - Intro 00:27 - LLM Lifecycle Overview 04:03 - Supervised Fine Tuning 07:44 - Reinforcement Learning from Human Feedback 11:18 - Direct Preference Optimization 13:49 - Odds Ratio Preference Alignment 17:09 - Applying ORPO to Train Llama-3.2-1B 24:23 - Closing Thoughts #ai #coding #datascience