У нас вы можете посмотреть бесплатно A proposed solution to improve reliability by containing the impact of PCIe Uncorrected Errors или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
Presented by Anil Agrawal (Meta) | Gada Badeer (Meta) Meta's next generation of AI/ML platform called "Grand Teton Training" uses a complex hierarcy of PCIe devices including GPUs, Switches, NICs, and NVMe drivers and require various RAS features to improve the system reliability. In this presentation, we would share the key learnings as we developed this platform and propose an optimized solution to contain any risk of data corruption due to PCIe uncorrected errors.