• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

Cost Optimization and Performance // LLMs in Production Conference Panel Discussion 2 скачать в хорошем качестве

Cost Optimization and Performance // LLMs in Production Conference Panel Discussion 2 2 года назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Cost Optimization and Performance // LLMs in Production Conference Panel Discussion 2
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: Cost Optimization and Performance // LLMs in Production Conference Panel Discussion 2 в качестве 4k

У нас вы можете посмотреть бесплатно Cost Optimization and Performance // LLMs in Production Conference Panel Discussion 2 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон Cost Optimization and Performance // LLMs in Production Conference Panel Discussion 2 в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



Cost Optimization and Performance // LLMs in Production Conference Panel Discussion 2

// Abstract In this panel discussion, the topic of the cost of running large language models (LLMs) is explored, along with potential solutions. The benefits of bringing LLMs in-house, such as latency optimization and greater control, are also discussed. The panelists explore methods such as structured pruning and knowledge distillation for optimizing LLMs. OctoML's platform is mentioned as a tool for the automatic deployment of custom models and for selecting the most appropriate hardware for them. Overall, the discussion provides insights into the challenges of managing LLMs and potential strategies for overcoming them. // Bio Lina Weichbrodt Lina is a pragmatic freelancer and machine learning consultant that likes to solve business problems end-to-end and make machine learning or a simple, fast heuristic work in the real world. In her spare time, Lina likes to exchange with other people on how they can implement best practices in machine learning, talk to her at the Machine Learning Ops Slack: shorturl.at/swxIN. She works with LLMs at her current client, a stealth startup. Lina will be moderating the panel. Luis Ceze Luis Ceze is Co-Founder and CEO of OctoML, which enables businesses to seamlessly deploy ML models to production making the most out of the hardware. OctoML is backed by Tiger Global, Addition, Amplify Partners, and Madrona Venture Group. Ceze is the Lazowska Professor in the Paul G. Allen School of Computer Science and Engineering at the University of Washington, where he has taught for 15 years. Luis co-directs the Systems and Architectures for Machine Learning lab (sampl.ai), which co-authored Apache TVM, a leading open-source ML stack for performance and portability that is used in widely deployed AI applications. Luis is also co-director of the Molecular Information Systems Lab (misl.bio), which led pioneering research in the intersection of computing and biology for IT applications such as DNA data storage. His research has been featured prominently in the media including New York Times, Popular Science, MIT Technology Review, and the Wall Street Journal. Ceze is a Venture Partner at Madrona Venture Group and leads their technical advisory board. Jared Zoneraich Co-Founder of PromptLayer, enabling data-driven prompt engineering. Compulsive builder. Jersey native, with a brief stint in California (UC Berkeley '20) and now residing in NYC. Daniel Campos Hailing from Mexico Daniel started his NLP journey with his BS in CS from RPI. He then worked at Microsoft on Ranking at Bing with LLM(back when they had 2 commas) and helped build out popular datasets like MSMARCO and TREC Deep Learning. While at Microsoft he got his MS in Computational Linguistics from the University of Washington with a focus on Curriculum Learning for Language Models. Most recently, he has been pursuing his Ph.D. at the University of Illinois Urbana Champaign focusing on efficient inference for LLMs and robust dense retrieval. During his Ph.D., he worked for companies like Neural Magic, Walmart, Qualtrics, and Mendel.AI and now works on bringing LLMs to search at Neeva. Mario Kostelac Currently building AI-powered products in Intercom in a small, highly effective team. I roam between practical research and engineering but lean more towards engineering and challenges around running reliable, safe, and predictable ML systems. You can imagine how fun it is in LLM era :). Generally interested in the intersection of product and tech, and building a differentiation by solving hard challenges (technical or non-technical). Software engineer turned into Machine Learning engineer 5 years ago.

Comments
  • Agentic Relationship Management // Ashe Magalhaes // LLMs in Production Conference Lightning Talk 2 года назад
    Agentic Relationship Management // Ashe Magalhaes // LLMs in Production Conference Lightning Talk
    Опубликовано: 2 года назад
  • Освоение оптимизации вывода LLM: от теории до экономически эффективного внедрения: Марк Мойу 1 год назад
    Освоение оптимизации вывода LLM: от теории до экономически эффективного внедрения: Марк Мойу
    Опубликовано: 1 год назад
  • Large Language Models in Production Round-table Conversation 2 года назад
    Large Language Models in Production Round-table Conversation
    Опубликовано: 2 года назад
  • Поиск работы стал унижением — за что ненавидят HR 2 дня назад
    Поиск работы стал унижением — за что ненавидят HR
    Опубликовано: 2 дня назад
  • A complete guide to ML SYSTEM DESIGN interview for META & GOOGLE | MULTIMODAL SEARCH SYSTEM DESIGN 10 месяцев назад
    A complete guide to ML SYSTEM DESIGN interview for META & GOOGLE | MULTIMODAL SEARCH SYSTEM DESIGN
    Опубликовано: 10 месяцев назад
  • Интервью с создателем OpenClaw - главный ИИ-феномен 2026 6 дней назад
    Интервью с создателем OpenClaw - главный ИИ-феномен 2026
    Опубликовано: 6 дней назад
  • Feedback Loops for Agentic Workflows 1 месяц назад
    Feedback Loops for Agentic Workflows
    Опубликовано: 1 месяц назад
  • OpenClaw: чит-код для продуктивности или подарок хакерам? 1 день назад
    OpenClaw: чит-код для продуктивности или подарок хакерам?
    Опубликовано: 1 день назад
  • Модель контекстного протокола (MCP), четко объясненная (почему это важно) 11 месяцев назад
    Модель контекстного протокола (MCP), четко объясненная (почему это важно)
    Опубликовано: 11 месяцев назад
  • Context Optimization vs LLM Optimization: Choosing the Right Approach 1 год назад
    Context Optimization vs LLM Optimization: Choosing the Right Approach
    Опубликовано: 1 год назад
  • Проблема нержавеющей стали 7 дней назад
    Проблема нержавеющей стали
    Опубликовано: 7 дней назад
  • Deploying Capital for Climate - Online Webinar By Powertrain Ventures 2 недели назад
    Deploying Capital for Climate - Online Webinar By Powertrain Ventures
    Опубликовано: 2 недели назад
  • Экспресс-курс RAG для начинающих 4 месяца назад
    Экспресс-курс RAG для начинающих
    Опубликовано: 4 месяца назад
  • 🎙 Честное слово с Владимиром Миловым Трансляция закончилась 22 часа назад
    🎙 Честное слово с Владимиром Миловым
    Опубликовано: Трансляция закончилась 22 часа назад
  • Roadmap Вайбкодера 2026 - с Нуля до Релиза 3 недели назад
    Roadmap Вайбкодера 2026 - с Нуля до Релиза
    Опубликовано: 3 недели назад
  • Лучший документальный фильм про создание ИИ 1 месяц назад
    Лучший документальный фильм про создание ИИ
    Опубликовано: 1 месяц назад
  • Jay Modh - Maximizing ROI in Generative AI: Cost Optimization Strategies for CIOs 1 год назад
    Jay Modh - Maximizing ROI in Generative AI: Cost Optimization Strategies for CIOs
    Опубликовано: 1 год назад
  • Кодирование с использованием ИИ // Чип Хуен 4 недели назад
    Кодирование с использованием ИИ // Чип Хуен
    Опубликовано: 4 недели назад
  • Как создаются степени магистра права? 3 месяца назад
    Как создаются степени магистра права?
    Опубликовано: 3 месяца назад
  • Impactful Al for Commercial Teams 2 недели назад
    Impactful Al for Commercial Teams
    Опубликовано: 2 недели назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5