У нас вы можете посмотреть бесплатно 通义千问技术负责人离职,阿里HR捅了多大篓子?|亚马逊AGI查晟:大模型训练的一线实践 или скачать в максимальном доступном качестве, видео которое было загружено на ютуб. Для загрузки выберите вариант из формы ниже:
Если кнопки скачивания не
загрузились
НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием видео, пожалуйста напишите в поддержку по адресу внизу
страницы.
Спасибо за использование сервиса ClipSaver.ru
AI课程/风水宝地: https://www.superlinear.academy/ai-bu... 两小时完整版: • 查晟:大模型训练的真相、NVIDIA 的护城河、以及为什么大厂做不好 AI 为什么 DeepSeek 能以 1% 的成本训练出顶尖模型,而拥有海量资源的硅谷巨头却步履维艰?训练大模型到底是玄学还是科学? 本期视频,我们邀请到了 Amazon AGI 资深经理(Senior Manager)查晟。他曾与 Alex Smola、李沐等 AI 巨匠共事,深度参与了亚马逊第一代大模型的研发以及目前 Frontier 模型的训练。他将从技术路线、实验方法论、基础设施以及人才密度等维度,带你揭开大模型训练背后的真实挑战。 你将在这段视频中获得: 避坑指南:为什么模型在小规模实验时效果很好,Scale Up 之后却突然“崩了”? 内部策略:为什么一个高产的团队应该追求 50% 的失败率?如何通过“信息增益”优化研发? 硬核工程:GPU 功率激增为何会导致数据中心宕机?“静默数据损坏”如何毁掉一个模型? 行业真相:公开榜单(Benchmarks)是如何被刷分的?为什么大厂必须拥有“秘密评测集”? 未来判断:AI 自我进化的临界点在哪?当初级岗位消失,科技从业者该如何转型? 这是一场拒绝空谈、直面工程细节的深度对谈。无论你是 AI 从业者,还是对技术变革感到焦虑的观察者,查晟的视角都会为你提供极具价值的参考。 00:00 开场 01:14 嘉宾介绍:查晟与Amazon AGI 02:23 大模型训练的基本原理与为什么这么难 07:47 反直觉的实验方法:为什么要做失败率50%的事 09:05 训练大模型需要哪些团队协作 15:15 数据质量:微波炉社区、SEO垃圾与合成数据的边界 21:04 Evaluation为什么是最重要也最容易出错的环节 29:57 团队如何衡量研发进度(cost-to-accuracy框架) 36:01 人才缺口与NVIDIA的护城河 39:26 未来趋势:模型自主学习将改变什么 45:33 AI时代的职业与经济冲击 53:33 结语