• ClipSaver
  • dtub.ru
ClipSaver
Русские видео
  • Смешные видео
  • Приколы
  • Обзоры
  • Новости
  • Тесты
  • Спорт
  • Любовь
  • Музыка
  • Разное
Сейчас в тренде
  • Фейгин лайф
  • Три кота
  • Самвел адамян
  • А4 ютуб
  • скачать бит
  • гитара с нуля
Иностранные видео
  • Funny Babies
  • Funny Sports
  • Funny Animals
  • Funny Pranks
  • Funny Magic
  • Funny Vines
  • Funny Virals
  • Funny K-Pop

[Scheduling seminar] Zijie Zhou (IEDA, HKUST) | Efficient and Robust LLM Scheduling скачать в хорошем качестве

[Scheduling seminar] Zijie Zhou (IEDA, HKUST) | Efficient and Robust LLM Scheduling Трансляция закончилась 2 месяца назад

скачать видео

скачать mp3

скачать mp4

поделиться

телефон с камерой

телефон с видео

бесплатно

загрузить,

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
[Scheduling seminar] Zijie Zhou (IEDA, HKUST) | Efficient and Robust LLM Scheduling
  • Поделиться ВК
  • Поделиться в ОК
  •  
  •  


Скачать видео с ютуб по ссылке или смотреть без блокировок на сайте: [Scheduling seminar] Zijie Zhou (IEDA, HKUST) | Efficient and Robust LLM Scheduling в качестве 4k

У нас вы можете посмотреть бесплатно [Scheduling seminar] Zijie Zhou (IEDA, HKUST) | Efficient and Robust LLM Scheduling или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:

  • Информация по загрузке:

Скачать mp3 с ютуба отдельным файлом. Бесплатный рингтон [Scheduling seminar] Zijie Zhou (IEDA, HKUST) | Efficient and Robust LLM Scheduling в формате MP3:


Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса ClipSaver.ru



[Scheduling seminar] Zijie Zhou (IEDA, HKUST) | Efficient and Robust LLM Scheduling

Keywords: Scheduling, Optimization for LLM inference, Approximation online algorithms We study the problem of optimizing Large Language Model (LLM) inference scheduling to minimize total completion time. LLM inference is an online and multi-task service process and also heavily energy consuming by which a pre-trained LLM processes input requests and generates output tokens sequentially. Therefore, it is vital to improve its scheduling efficiency and reduce the power consumption while a great amount of prompt requests are arriving. There are two key challenges: (i) each request has heterogeneous prefill and decode lengths. In LLM serving, the prefill length corresponds to the input prompt length, which determines the initial memory usage in the KV cache. The decode length refers to the number of output tokens generated sequentially, with each additional token increasing the KV cache memory usage by one unit. We show that minimizing total completion time is NP-hard due to the interplay of batching, placement constraints, precedence relationships, and linearly increasing memory usage. We then analyze commonly used scheduling strategies in practice, such as First-Come-First-Serve (FCFS) and Shortest-First (SF), and prove that their competitive ratios are unbounded. To address this, we propose a novel algorithm based on a new selection metric that efficiently forms batches over time. We prove that this algorithm achieves a constant competitive ratio. (ii) the output length, which critically impacts memory usage and processing time, is unknown. We first design a conservative algorithm, Amax, which schedules requests based on the upper bound of predicted output lengths to prevent memory overflow. However, this approach is overly conservative: as prediction accuracy decreases, performance degrades significantly due to potential overestimation. To overcome this limitation, we propose Amin, an adaptive algorithm that initially treats the predicted lower bound as the output length and dynamically refines this estimate during inferencing. We prove that Amin achieves a log-scale competitive ratio. Organized by Zdenek Hanzalek (CTU in Prague), Michael Pinedo (New York University), and Guohua Wan (Shanghai Jiao Tong). Seminar's webpage: https://schedulingseminar.com/

Comments
  • [Scheduling seminar] Laurent Perron (Google France) | The CP-SAT solver Трансляция закончилась 1 год назад
    [Scheduling seminar] Laurent Perron (Google France) | The CP-SAT solver
    Опубликовано: Трансляция закончилась 1 год назад
  • [Scheduling seminar] Changhyun Kwon (KAIST/Omelet, Inc.) | Learning-Based Approaches to Comb. Prob. Трансляция закончилась 3 месяца назад
    [Scheduling seminar] Changhyun Kwon (KAIST/Omelet, Inc.) | Learning-Based Approaches to Comb. Prob.
    Опубликовано: Трансляция закончилась 3 месяца назад
  • [Scheduling seminar] Pieter Smet (KU Leuven) | Robustness in personnel rostering Трансляция закончилась 1 год назад
    [Scheduling seminar] Pieter Smet (KU Leuven) | Robustness in personnel rostering
    Опубликовано: Трансляция закончилась 1 год назад
  • Синьор 1С: 10 привычек, без которых ты не вырастешь 1 день назад
    Синьор 1С: 10 привычек, без которых ты не вырастешь
    Опубликовано: 1 день назад
  • Численное несоответствие в LLM RL 11 дней назад
    Численное несоответствие в LLM RL
    Опубликовано: 11 дней назад
  • [Scheduling seminar] Ender Ozcan (Uni of Nottingham) | Machine Learning meets Sel. Hyper-heuristic Трансляция закончилась 1 год назад
    [Scheduling seminar] Ender Ozcan (Uni of Nottingham) | Machine Learning meets Sel. Hyper-heuristic
    Опубликовано: Трансляция закончилась 1 год назад
  • [Scheduling Seminar] Laurent Houssin (ENAC, UT) Flow-shop and job-shop robust scheduling problems Трансляция закончилась 1 месяц назад
    [Scheduling Seminar] Laurent Houssin (ENAC, UT) Flow-shop and job-shop robust scheduling problems
    Опубликовано: Трансляция закончилась 1 месяц назад
  • Краткое объяснение больших языковых моделей 1 год назад
    Краткое объяснение больших языковых моделей
    Опубликовано: 1 год назад
  • Understanding the Discrete Fourier Transform and the FFT 2 года назад
    Understanding the Discrete Fourier Transform and the FFT
    Опубликовано: 2 года назад
  • Richard Sutton – Father of RL thinks LLMs are a dead end 3 месяца назад
    Richard Sutton – Father of RL thinks LLMs are a dead end
    Опубликовано: 3 месяца назад
  • LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры 1 год назад
    LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры
    Опубликовано: 1 год назад
  • [Scheduling seminar] André Rossi (Universite PSL) | Maximizing stability of assembly line... Трансляция закончилась 1 год назад
    [Scheduling seminar] André Rossi (Universite PSL) | Maximizing stability of assembly line...
    Опубликовано: Трансляция закончилась 1 год назад
  • [Scheduling seminar] Přemysl Šůcha (CTU in Prague) | Machine Learning Inside Decomposition Трансляция закончилась 9 месяцев назад
    [Scheduling seminar] Přemysl Šůcha (CTU in Prague) | Machine Learning Inside Decomposition
    Опубликовано: Трансляция закончилась 9 месяцев назад
  • [Scheduling seminar] Philippe Laborie (Hexaly) | Hexaly Optimizer for Scheduling Трансляция закончилась 1 год назад
    [Scheduling seminar] Philippe Laborie (Hexaly) | Hexaly Optimizer for Scheduling
    Опубликовано: Трансляция закончилась 1 год назад
  • Глубокое погружение: оптимизация вывода LLM 1 год назад
    Глубокое погружение: оптимизация вывода LLM
    Опубликовано: 1 год назад
  • The Only Trait for Success in the AI Era—How to Build It | Carnegie Mellon University Po-Shen Loh 4 месяца назад
    The Only Trait for Success in the AI Era—How to Build It | Carnegie Mellon University Po-Shen Loh
    Опубликовано: 4 месяца назад
  • RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models 9 месяцев назад
    RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models
    Опубликовано: 9 месяцев назад
  • The Strange Math That Predicts (Almost) Anything 5 месяцев назад
    The Strange Math That Predicts (Almost) Anything
    Опубликовано: 5 месяцев назад
  • Mathematics of LLMs in Everyday Language 6 месяцев назад
    Mathematics of LLMs in Everyday Language
    Опубликовано: 6 месяцев назад
  • [Scheduling seminar] Matthias Mnich (TU Hamburg) | New Support Size Bounds for Integer Programming Трансляция закончилась 1 год назад
    [Scheduling seminar] Matthias Mnich (TU Hamburg) | New Support Size Bounds for Integer Programming
    Опубликовано: Трансляция закончилась 1 год назад

Контактный email для правообладателей: u2beadvert@gmail.com © 2017 - 2026

Отказ от ответственности - Disclaimer Правообладателям - DMCA Условия использования сайта - TOS



Карта сайта 1 Карта сайта 2 Карта сайта 3 Карта сайта 4 Карта сайта 5