У нас вы можете посмотреть бесплатно NVIDIA, HBM 버리고 택한 이것... GTC 2026 공개할 AI 추론칩 신의 한수 | 삼성 파운드리 부활로 보는 이유 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
GTC 2026에서 NVIDIA가 추론 전용 프로세서를 공개할 것으로 보도되고 있습니다. 핵심은 기존 GPU의 HBM이 아닌 온칩 SRAM을 활용해 Decode 단계를 처리하는 구조입니다. LLM 인퍼런스가 Prefill과 Decode로 나뉘는데, 왜 Decode에는 GPU보다 SRAM 기반 칩이 유리한지를 메모리 하이어라키 관점에서 풀어봤습니다. SRAM의 80TB/s 대역폭과 결정론적 실행이 에이전틱 AI의 수백 단계 추론 체인에서 왜 결정적인 차이를 만드는지도 다룹니다. OpenAI가 3GW 규모의 전용 인퍼런스 용량을 확보하려는 배경과, 이것이 단순 속도 개선이 아니라 에이전트 시대 인프라 구축이라는 점을 짚었습니다. SRAM이 HBM을 대체하는 게 아니라 메모리 계층이 세분화되는 것이고, HBM 수요가 줄어들지 않는 구조적 이유도 정리했습니다. 3nm 이후 SRAM 스케일링이 정체된 상황이 이 칩의 공정 전환에 어떤 제약을 주는지, 그리고 삼성 테일러 팹이 이 흐름에서 왜 주목받는 포지션인지도 분석합니다. GPU 한 종류로 모든 걸 처리하던 시대에서 Prefill은 GPU, Decode는 전용칩으로 분리하는 이종 아키텍처 시대가 열리고 있습니다. Written by Error Edited by Error unrealtech2021@gmail.com