推理领域的圈地大战开始
本文信息来源:investinginai
Jensen 深知,未来在于运行模型,而非训练模型
周日快乐,欢迎来到《Investing in AI》。如果你还没看过,一定要去看看在纽约举办的 AI in NYC 节目。在最新一期节目中,我们讨论了 ChatGPT Health、Grok 的非自愿图像风波,团队还用 Grok 给我生成了一张搞笑的图片(第 27 分钟)。另外,如果你听说过“系统 1”与“系统 2”思维,并且正在构建系统 2 AI,不妨看看 Neurometric Leaderboard——这是唯一一个专注于系统 2、多轮或多步骤代理式工作流的排行榜。如果你的系统设计已经超越系统 1,我们可以帮助你选择合适的模型。
今天我想谈谈 NVIDIA 收购 Groq 以及这一举措在战略层面意味着什么。先从 NVIDIA 买下了什么说起。
NVIDIA 并不是以传统意义上的方式收购 Groq。沿用了其 9 亿美元 Enfabrica 交易以及 Microsoft 对 Inflection 交易中采用的“收购式招聘”(acqui-hire)模式,NVIDIA 拿下的是知识产权(IP)和人才 ,而将公司的空壳留在原处,以规避反垄断方面的雷区。
- LPU 架构:NVIDIA 现已获得 Groq 的语言处理单元(LPU)IP 的非独家许可证——这是一种从零开始为速度而设计的、基于 SRAM 的确定性架构。
- 人才: 约 90% 的 Groq 员工(约 550 人)将加入 NVIDIA。其中包括创始人 Jonathan Ross(Google TPU 的共同创造者)以及总裁 Sunny Madra。
- 剩余业务:GroqCloud 将在新任 CEO Simon Edwards 的领导下继续独立运营,服务其现有的开发者群体。
这种结构使 NVIDIA 能够动用其 600 亿美元以上的现金储备 ,在不引发全面并购监管摩擦的情况下“掏空”一家竞争对手。这是一种外科手术式的价值抽取。
这完成了 NVIDIA 的 AI 工厂版图
NVIDIA 已经主导了“训练”市场。随着 Groq 的加入,他们正在锁定“推理”领域。首席执行官黄仁勋指出,此举的目标是 “将 Groq 的低延迟处理器整合进 NVIDIA 的 AI 工厂架构。”
引入 Jonathan Ross 堪称防御性的天才之举。Ross 打造了 TPU,这是唯一一个在规模化层面真正挑战过 NVIDIA 主导地位的芯片家族。通过将他纳入麾下,NVIDIA 把最具可信度的威胁转化为自身最重要的架构师。
这笔交易是更广泛的“现金转护城河”转化策略的一部分。过去一年里,NVIDIA 积极出手,通过对 Crusoe、Cohere、CoreWeave 的大规模投资,甚至提出对 OpenAI 高达 1000 亿美元的持股 ,将 GPU 替代方案变成盟友或子公司。
弥补“推理鸿沟”的短板
尽管 NVIDIA 的 GPU 是训练领域的黄金标准,但在推理方面却存在先天的架构盲点。GPU 是概率型且以批处理为导向 ;在一次性处理海量数据时表现最佳。
相比之下,Groq 的 LPU 是确定性且以单 Token 为导向 。

随着 AI 模型日益商品化,运行模型(推理)的经济性比构建模型(训练)的成本更为重要。Google(TPU)、Amazon(Trainium)和 Microsoft(Maia)等超大规模云服务商都在自研芯片,以摆脱“英伟达税”。Groq 曾是唯一一家为语音 AI、机器人和自动化系统等实时工作负载提供“足够好”替代方案的独立初创公司。通过中和 Groq,NVIDIA 关闭了这条逃生通道。
这对推理领域意味着什么
向市场释放的信号十分明确: 长期收入的核心在于推理。 训练是一项规模庞大、一次性的资本性支出(CapEx);而推理则是每当用户向模型发出提示时都会发生的、可持续扩展的经常性运营支出(OpEx)。
- 行业整合加速: 像 Cerebras、SambaNova 和 Tenstorrent 这样的初创公司,如今面对的竞争对手不仅拥有最强的训练芯片,还掌握着最顶级的推理 IP。
- 投资组合影响: 对投资者而言,NVIDIA 的护城河显著加深。然而,独立“AI 芯片”赛道的风险已大幅飙升。你现在是在与一家可以豪掷 200 亿美元,只为其技术栈买下一个“功能”的公司竞争。
剩余玩家
这不仅仅是一笔芯片交易;而是一份保险。 Nvidia 以 200 亿美元的价格支付了巨额溢价,确保当世界从构建 AI 迈向使用 AI 时,他们的生态系统不存在任何可信的替代方案。他们通过收购最先进的技术进行进攻,同时通过确保他人无法获得这些技术来构筑防线。
为 Groq 支付的 200 亿美元不仅买下了一款芯片,更买下了一道“速度护城河”,迫使剩余玩家重新思考各自的生存策略。以下将深入分析在后 Groq 时代仍保持独立的推理领域幸存者,以及他们的护城河如何发生变化。
还剩下什么?让我们来看一看市场中正在上演的架构性“碰撞”。每一家仍在场的初创公司,都在押注于一种不同的物理数据传输方式。
- Cerebras(晶圆级): 通过将芯片做得极其庞大,他们避免了在不同芯片之间传输数据所产生的“税负”。这是追求速度的终极蛮力方案。
- SambaNova(可重构数据流): 他们让硬件能够在物理层面重新排列,以匹配 AI 模型的“形状”。
- Tenstorrent(RISC-V): 他们采用“乐高”式方法——由小型、模块化的芯粒组成,可组合成适用于汽车、机器人或服务器的定制 AI 大脑。
剩余的护城河:他们为何(暂时)尚未出局
尽管 NVIDIA 占据主导地位,但有三个因素让这些独立玩家仍能留在赛场上:
- 供应链焦虑: 主要云服务提供商(Azure、AWS)以及大型主权实体(欧盟、日本、中东)对 NVIDIA 形成全面垄断深感恐惧。为保持定价杠杆,他们将继续资助“替代方案一”和“替代方案二”。
- “内部自研”的局限性:Nvidia 对 Groq 的收购属于“资产购买”。要将 Groq 的 LPU 技术完全融入下一代 Rubin 或 Vera Rubin GPU 架构,还需要 12–18 个月。在这段时间窗口内,像 Cerebras 这样的初创公司仍有机会抢占市场份额。
- 边缘 vs. 数据中心: 尽管 Nvidia/Groq 在庞大的数据中心领域占据主导地位,但“边缘”——也就是汽车、眼镜或工业机器人内部的芯片——仍是一片尚未开垦的前沿领域,在这里,能效比原始的 token 速度更为重要。
到2026年底,所有人的关注焦点都将集中在推理经济上。如果你要进行投资押注,这将是入手的起点。
感谢阅读。