У нас вы можете посмотреть бесплатно Run performant and cost-effective GenAI Applications with AWS Graviton and Arcee AI или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Live session on Twitch, 11/19/2024 We first discuss why AWS Graviton CPU instances are a great fit for AI inference, particularly for Small Language Models. To prove our point, we then run inference with Llama-3.1-SuperNova Lite 8B on a small Graviton4 instance, thanks to quantization and llama.cpp. ⭐️⭐️⭐️ Don't forget to subscribe to be notified of future videos. You can become a channel member and enjoy exclusive perks: details at / @juliensimonfr You can also follow me on Medium at / julsimon or Substack at https://julsimon.substack.com. ⭐️⭐️⭐️ Model: https://huggingface.co/arcee-ai/Llama... Llama.cpp: https://github.com/ggerganov/llama.cpp