活动预告🥳:8 月 16 日,我们会办一场线上活动,嘉宾是 Luma AI 模型产品 Lead 戴高乐、爱诗科技联创谢旭璋、前 OpusClip 增长产品负责人谢君陶,大家记得翻到 shownotes 末尾查看报名信息!本期嘉宾朱亦博可以说是国内最懂 AI Infra 的人之一。从微软、字节 AI Infra 负责人到谷歌、再到阶跃联创,他的职业经历几乎和 AI Infra 的发展并行,如他所说,贾扬清、李沐等人可能是 AI Infra 的开路者,而他则是紧随其后的第二批从业者。在这期播客中,亦博不仅分享了 AI Infra 的底层认知,也讲了很多行业的内幕故事与实战细节。我们从最基础的 AI Infra 定义聊起,解答了其在模型表现中的作用、重要性,也揭示了“优化指标”的意义与评判标准,并讨论了行业现状和未来发展等等内容。听完这期,你可能会意识到:在大模型时代,AI Infra 不只是「降本」的后台支持,也是决定一家 AI 公司能走多远的核心战斗力。BTW:阶跃最近刚刚开源了推理效率更高的基模 Step 3(github.com),亦博自己的团队也在招人中,感兴趣的可以联系邮箱:
[email protected]【人类博物馆】导游:曲凯,42章经创始人39 号珍藏:朱亦博,阶跃星辰联合创始人,前字节 AI Infra 负责人,也曾在微软、Google 任职 1:07 AI Infra 的定义 2:49 贾扬清、李沐是 AI Infra 的第一批人,我属于第二批 4:13 为什么说 Infra 迎来了一个新的 Google 级别的机会? 6:21 移动互联网 vs 大模型时代:两代 Infra 有什么异同? 7:38 算法人可能「只有 2 年的保质期」,Infra 更吃经验 8:40 怎么衡量 AI Infra 的好坏?几个关键指标 10:09 该不该、该怎么投入 Infra?一笔很好量化的 ROI 账 11:20 面对云厂商和模型公司的挤压,第三方公司的突破口是什么? 14:17 对 Infra 人的一句忠告:要么深入模型、要么深入硬件 16:15 AI Infra 对模型效果到底有多大的影响? 17:45 DeepSeek 能冲出来,一大原因是选对了优化目标 20:04 阶跃现在最重视的优化目标是什么? 22:06 Infra、算法、数据团队之间该怎么配合?有关组织架构的心得体会 28:41 做 AI Infra 最大的阻碍是什么? 30:16 模型范式不会那么快革新,但多模态可能是一个突破口 32:29 简评几家硅谷当红 AI Infra 公司 34:15 第三方 AI Infra 的创业机会在哪里? 36:35 我们想提升国产卡的竞争力,哪怕只有一点点 39:28 介绍一下阶跃新发布的视觉推理模型 46:30 DeepSeek 做得好,就是因为梁文锋懂 Infra? 47:54 一些业内真实的踩坑案例 55:13 给 Infra 从业者的一些建议 55:43 《The Bitter Lesson》的含金量还在上升【活动预告🥳】8 月 16 日,我们会办一场线上活动。感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流!【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros