У нас вы можете посмотреть бесплатно Как обеспечить работу больших LLM-блоков на децентрализованных графических процессорах? | Паралла... или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Развертывание крупного сервиса вывода LLM — сложная и очень дорогостоящая задача. Обычно она доступна компаниям, имеющим доступ к высокопроизводительным графическим процессорам с высокоскоростными межсоединениями, размещенным в специализированных центрах обработки данных. В этом видео я покажу вам децентрализованную методологию планирования для использования гетерогенных графических процессоров по всему миру с помощью Parallax! Интересные статьи и ссылки: 📌 статья: https://arxiv.org/pdf/2509.26182 📌 блог для создания собственного крупного LLM-проекта: https://gradient.network/research/par... Также для начинающих: 📌 научитесь программировать от full-stack до ИИ с помощью Scrimba https://scrimba.com/?via=yacineMahdid (дополнительная скидка 20% на Pro-версию по моей ссылке, отличный ресурс, мне нравится команда) Содержание Введение: 0:00 Обзор Parallax: 1:30 Фаза 1: Распределение слоев модели: 6:25 Фаза 1: Метод заполнения водой: 16:10 Фаза 2: Выбор цепочки конвейера: 21:10 «Фаза 3»: Динамическая перебалансировка: 28:40 Обзор результатов: 31:18 Сравнение задержки и пропускной способности: 32:39 Исследование масштабируемости: 34:20 Заключение: 36:50 О Parallax: Parallax — это система, разработанная для создания эффективной децентрализованной методологии вывода LLM, которая может использовать сеть графических процессоров вместо того, чтобы полагаться только на централизованные центры обработки данных. Поскольку графические процессоры в децентрализованных средах различаются по скорости, памяти и качеству сети, Parallax использует двухэтапный подход к планированию. Сначала он распределяет части модели по доступным графическим процессорам в эффективном конвейере. Затем, когда поступают запросы пользователей, он динамически выбирает оптимальный путь выполнения для минимизации задержки и максимизации пропускной способности. В целом, Parallax демонстрирует, что децентрализованное оборудование может эффективно обслуживать большие модели ИИ, потенциально делая инфраструктуру ИИ более доступной и экономически эффективной. Кстати, это также отличный пример динамического программирования, посмотрите! ---- Подпишитесь на рассылку, чтобы получать еженедельный контент об ИИ: https://yacinemahdid.com Присоединяйтесь к Discord для общего обсуждения: / discord ---- Следите за мной онлайн: Twitter: / yacinelearning LinkedIn: / yacinemahdid ___ Желаю вам отличной недели! 👋