推理领域的圈地大战开始

本文信息来源：investinginai

Jensen 深知，未来在于运行模型，而非训练模型

周日快乐，欢迎来到《Investing in AI》。如果你还没看过，一定要去看看在纽约举办的 AI in NYC 节目。在最新一期节目中，我们讨论了 ChatGPT Health、Grok 的非自愿图像风波，团队还用 Grok 给我生成了一张搞笑的图片（第 27 分钟）。另外，如果你听说过“系统 1”与“系统 2”思维，并且正在构建系统 2 AI，不妨看看 Neurometric Leaderboard——这是唯一一个专注于系统 2、多轮或多步骤代理式工作流的排行榜。如果你的系统设计已经超越系统 1，我们可以帮助你选择合适的模型。

今天我想谈谈 NVIDIA 收购 Groq 以及这一举措在战略层面意味着什么。先从 NVIDIA 买下了什么说起。

NVIDIA 并不是以传统意义上的方式收购 Groq。沿用了其 9 亿美元 Enfabrica 交易以及 Microsoft 对 Inflection 交易中采用的“收购式招聘”（acqui-hire）模式，NVIDIA 拿下的是知识产权（IP）和人才 ，而将公司的空壳留在原处，以规避反垄断方面的雷区。

LPU 架构：NVIDIA 现已获得 Groq 的语言处理单元（LPU）IP 的非独家许可证——这是一种从零开始为速度而设计的、基于 SRAM 的确定性架构。
人才： 约 90% 的 Groq 员工（约 550 人）将加入 NVIDIA。其中包括创始人 Jonathan Ross（Google TPU 的共同创造者）以及总裁 Sunny Madra。
剩余业务：GroqCloud 将在新任 CEO Simon Edwards 的领导下继续独立运营，服务其现有的开发者群体。

这种结构使 NVIDIA 能够动用其 600 亿美元以上的现金储备 ，在不引发全面并购监管摩擦的情况下“掏空”一家竞争对手。这是一种外科手术式的价值抽取。

这完成了 NVIDIA 的 AI 工厂版图

NVIDIA 已经主导了“训练”市场。随着 Groq 的加入，他们正在锁定“推理”领域。首席执行官黄仁勋指出，此举的目标是 “将 Groq 的低延迟处理器整合进 NVIDIA 的 AI 工厂架构。”

引入 Jonathan Ross 堪称防御性的天才之举。Ross 打造了 TPU，这是唯一一个在规模化层面真正挑战过 NVIDIA 主导地位的芯片家族。通过将他纳入麾下，NVIDIA 把最具可信度的威胁转化为自身最重要的架构师。

这笔交易是更广泛的“现金转护城河”转化策略的一部分。过去一年里，NVIDIA 积极出手，通过对 Crusoe、Cohere、CoreWeave 的大规模投资，甚至提出对 OpenAI 高达 1000 亿美元的持股 ，将 GPU 替代方案变成盟友或子公司。

弥补“推理鸿沟”的短板

尽管 NVIDIA 的 GPU 是训练领域的黄金标准，但在推理方面却存在先天的架构盲点。GPU 是概率型且以批处理为导向 ；在一次性处理海量数据时表现最佳。

相比之下，Groq 的 LPU 是确定性且以单 Token 为导向 。

随着 AI 模型日益商品化，运行模型（推理）的经济性比构建模型（训练）的成本更为重要。Google（TPU）、Amazon（Trainium）和 Microsoft（Maia）等超大规模云服务商都在自研芯片，以摆脱“英伟达税”。Groq 曾是唯一一家为语音 AI、机器人和自动化系统等实时工作负载提供“足够好”替代方案的独立初创公司。通过中和 Groq，NVIDIA 关闭了这条逃生通道。

这对推理领域意味着什么

向市场释放的信号十分明确： 长期收入的核心在于推理。 训练是一项规模庞大、一次性的资本性支出（CapEx）；而推理则是每当用户向模型发出提示时都会发生的、可持续扩展的经常性运营支出（OpEx）。

行业整合加速： 像 Cerebras、SambaNova 和 Tenstorrent 这样的初创公司，如今面对的竞争对手不仅拥有最强的训练芯片，还掌握着最顶级的推理 IP。
投资组合影响： 对投资者而言，NVIDIA 的护城河显著加深。然而，独立“AI 芯片”赛道的风险已大幅飙升。你现在是在与一家可以豪掷 200 亿美元，只为其技术栈买下一个“功能”的公司竞争。

剩余玩家

这不仅仅是一笔芯片交易；而是一份保险。 Nvidia 以 200 亿美元的价格支付了巨额溢价，确保当世界从构建 AI 迈向使用 AI 时，他们的生态系统不存在任何可信的替代方案。他们通过收购最先进的技术进行进攻，同时通过确保他人无法获得这些技术来构筑防线。

为 Groq 支付的 200 亿美元不仅买下了一款芯片，更买下了一道“速度护城河”，迫使剩余玩家重新思考各自的生存策略。以下将深入分析在后 Groq 时代仍保持独立的推理领域幸存者，以及他们的护城河如何发生变化。

还剩下什么？让我们来看一看市场中正在上演的架构性“碰撞”。每一家仍在场的初创公司，都在押注于一种不同的物理数据传输方式。

Cerebras（晶圆级）： 通过将芯片做得极其庞大，他们避免了在不同芯片之间传输数据所产生的“税负”。这是追求速度的终极蛮力方案。
SambaNova（可重构数据流）： 他们让硬件能够在物理层面重新排列，以匹配 AI 模型的“形状”。
Tenstorrent（RISC-V）： 他们采用“乐高”式方法——由小型、模块化的芯粒组成，可组合成适用于汽车、机器人或服务器的定制 AI 大脑。

剩余的护城河：他们为何（暂时）尚未出局

尽管 NVIDIA 占据主导地位，但有三个因素让这些独立玩家仍能留在赛场上：

供应链焦虑： 主要云服务提供商（Azure、AWS）以及大型主权实体（欧盟、日本、中东）对 NVIDIA 形成全面垄断深感恐惧。为保持定价杠杆，他们将继续资助“替代方案一”和“替代方案二”。
“内部自研”的局限性：Nvidia 对 Groq 的收购属于“资产购买”。要将 Groq 的 LPU 技术完全融入下一代 Rubin 或 Vera Rubin GPU 架构，还需要 12–18 个月。在这段时间窗口内，像 Cerebras 这样的初创公司仍有机会抢占市场份额。
边缘 vs. 数据中心： 尽管 Nvidia/Groq 在庞大的数据中心领域占据主导地位，但“边缘”——也就是汽车、眼镜或工业机器人内部的芯片——仍是一片尚未开垦的前沿领域，在这里，能效比原始的 token 速度更为重要。

到2026年底，所有人的关注焦点都将集中在推理经济上。如果你要进行投资押注，这将是入手的起点。

感谢阅读。

#大模型内核 #AI + 生命科学 #深度学习

推理领域的圈地大战开始

Jensen 深知，未来在于运行模型，而非训练模型

这完成了 NVIDIA 的 AI 工厂版图

弥补“推理鸿沟”的短板

这对推理领域意味着什么

剩余玩家

剩余的护城河：他们为何（暂时）尚未出局

推荐阅读

人工智能的捆绑时刻 | Tomasz Tunguz

伟大的重组：人类指南 – Foundation Capital

来自 100 多位 First-Check GP 和 LP 的关于今天获得资助的信号

心灵自行车 – Rex Woodbury – Digital Native

推理领域的圈地大战开始

Jensen 深知，未来在于运行模型，而非训练模型

这完成了 NVIDIA 的 AI 工厂版图

弥补“推理鸿沟”的短板

这对推理领域意味着什么

剩余玩家

剩余的护城河：他们为何（暂时）尚未出局

推荐阅读

人工智能的捆绑时刻 | Tomasz Tunguz

伟大的重组：人类指南 – Foundation Capital

来自 100 多位 First-Check GP 和 LP 的关于今天获得资助的信号

心灵自行车 – Rex Woodbury – Digital Native

了解 RecodeX 的更多信息