У нас вы можете посмотреть бесплатно MAGPIE Explained: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
The Allen Institute for AI and the University of Washington have developed a new approach to synthetic data generation that employs open models. This innovative method called MAGPIE tackles two major pain points in current open data creation methods: Making synthetic data generation scalable: MAGPIE does not require human intervention at any stage. No seed data needed! Instead, it leverages the instruction fine-tuning capabilities of models like Llama 3.1 Instruct to generate data prompting it with a pre-query template, making it possible to generate vast amounts of data without the need for manual input. Preserving data diversity at scale: One of the biggest challenges in synthetic data generation is maintaining the diversity of the text data as the size of the dataset grows. MAGPIE can produce large diverse datasets. We recorded a paper walkthrough where I break down the key findings and implications of this research.