У нас вы можете посмотреть бесплатно Алексей Гончаров | Быстрый и экономичный инференс LLM в прикладных задачах или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Спикер: Алексей Гончаров, основатель Compressa.ai Тема доклада: Поделится опытом оптимизации расходов на инференс LLM с применением квантования, дообучения моделей, LoRA адаптеров и низкоуровневых фреймворков инференса. Data Fest 2024: https://ods.ai/events/datafest2024 Презентацию к докладу Вы можете скачать в треке OptimalDL: https://ods.ai/tracks/df24-optimaldl ___ Наши соц.сети: Telegram: https://t.me/datafest Вконтакте: https://vk.com/datafest Канал с вакансиями в telegram: https://t.me/odsjobs Канал с апдейтами по курсам: https://t.me/odscourses Как попасть в чат сообщества ODS Mattermost: https://ods.ai/tracks/mattermost