解释 2026 年 AI 的两笔交易:推理与智能体成为大型科技公司年终并购狂潮中的真正战利品
本文信息来源:saanyaojha

新年快乐!当我们其他人还在圣诞节和新年之间的年度时间错位中徘徊,吃得过饱、甚至不确定今天是星期几时,Big Tech 已经开始了节日购物。在那些昏昏欲睡的年末几天里宣布的两笔交易,出人意料地清晰地揭示了 2026 年 AI 重心将走向何方。
NVIDIA x Groq:将推理作为控制平面
反向收购(reverse acquihire)又回来了。
Groq 为大语言模型打造专用的推理芯片,针对确定性延迟和极端吞吐量进行优化。它们的灵活性不如 GPU——而这正是关键所在:GPU 被设计为能够在多种不同工作负载下都表现得相当不错(例如训练、微调、批量推理、图形处理、HPC 等),而 Groq 则假设一个特定的服务型工作负载,并围绕它进行毫不留情的优化。在推理场景下,这种取舍带来了通用 GPU 根本无法匹敌的可预测性和速度。
NVIDIA 签署了一项 非独家许可协议,用于 Groq 的推理技术,更重要的是,吸纳了其核心技术智囊——创始人兼 CEO Jonathan Ross,他最为人所知的身份是 Google TPU 的架构师。据报道,这笔交易的价格高达 200 亿美元,约为 Groq 上一轮估值的 3 倍,对于律师们坚持称之为“并非收购”的交易而言,这是一个相当慷慨的数字。
这里正在发生三件事。
- 推理如今是利润池。 训练支出依然巨大,但可持续的利润空间在于服务环节,尤其是在代理型工作负载带来更多 token、更高的延迟敏感性以及持续在线的吞吐需求之下。Deloitte 估计 ,到 2025 年末,推理已超过训练,成为数据中心收入中占比更大的部分,并将在 2026 年约占总计算量的 2/3。这笔交易的核心在于保持在模型服务曲线上的领先优势。
- 对“仅依赖 GPU”推理的一种对冲。 NVIDIA 的 CEO 无需明说“GPU 已经过时”,就能暗示推理的某些环节更适合由其他方案来承担——即专用化、确定性强、能效更高的硬件。像 Groq 等硬件初创公司,以及 Google 的 TPU 等替代技术栈,正是因为单靠 GPU 已不再是唯一答案,才在推理市场的部分领域不断蚕食份额。
通过将 Groq 拉入自家阵营,NVIDIA 实际上是在为另一种推理架构买下一席之地。如果 NVIDIA 想继续让 CUDA 成为 AI 计算的通用语言,就必须确保以 CUDA 为中心的技术栈能够优雅地吸纳或绕行这些专用硬件。否则,最终会演变成一个世界:人们在 NVIDIA 上训练,却在别家的平台上部署推理,然后就此收工。 - 反向 Acquihire 依然活跃且运转良好。 Groq 将继续运营,其 CFO 将接任 CEO,但公司的技术灵魂已经离开。通过吸收塑造该系统的创始人,NVIDIA 在不触发全面收购所涉及的监管绊线的情况下,瓦解了一个潜在的未来竞争对手。在这个市场中,可迁移的直觉比 IP 更重要。创始人正日益成为最稀缺、也最有价值的资产类别。
表层叙事是“非独家许可 + 人才”。更深层的叙事则是“一堂关于架构风险管理的大师课”。
Meta x Manus:以 Agents 作为增长引擎
Manus 构建的是自主 AI Agents,能够跨工具和工作流采取行动,从对话式交互迈向面向消费者和企业的多步骤任务执行。该公司于去年春天才刚刚推出,却在八个月内实现了 1 亿美元 ARR,并声称在计入基于使用量的费用后,其运行收入更接近 1.25 亿美元。它还拥有中国背景——这一细节的重要性,已远超以往。
Meta 已同意收购 Manus,交易金额超过 20 亿美元,并明确承诺将解除其与中国的关联。计划是让 Manus 继续作为一个独立产品运营,同时将其代理能力编织进 Meta 的生态系统中,而 Meta AI 已经存在于该生态之内。
再次强调,有三点尤为突出。
- Meta 买的是“代理(agents)”,而不是另一个聊天机器人。 不论用户是否主动需求,Meta 已经在各处部署了聊天机器人——WhatsApp、Instagram、Facebook。Manus 带来的是执行层:工具使用、工作流、多步骤自治能力。这正是“会解释的 AI”与“真正能做有用事情的 AI”之间的差别。
- 代理是一种留存策略。 能够进行日程安排、购物、编辑、消息发送、内容创作和任务管理的代理,可以增加用户使用时长,并创造新的广告和电商入口。Meta 的不公平优势在于分发能力、身份体系以及无处不在的消息网络。代理正是将这种触达转化为日常实用价值,而非昙花一现的新奇体验的方式。
- 地缘政治如今已成为 AI 并购尽职调查的一部分。 明确切断与中国的联系,显示出前沿 AI 已变得何等敏感,尤其是对在重度监管审查下运营的消费级平台而言。对于消费规模的智能体来说,信任边界、数据来源以及监管层面的可接受性,都是产品规格的一部分。可以预期,这些约束将在很大程度上塑造智能体的设计,其影响不亚于模型能力本身。
Meta 的消费级 AI 叙事依然不清晰。除了那次混乱的聊天机器人发布,更多只是展示了哪些事情不该做之外,几乎看不出 Meta AI 究竟想成为什么。这笔交易可以从两个角度解读:其一,Meta 仍在向这个问题不断砸钱,希望通过足够大的覆盖面最终涌现出一致性;其二,Meta 悄然收购了一个真正具备平台潜力的资产,而且时机足够早,以至于其价值尚未显而易见。Instagram 和 WhatsApp 在诞生之初也并非看起来势不可挡。这两种结果之间的差距巨大,而 Meta 的历史表明,它完全可能落在其中任何一侧。
结缔组织
这些交易之所以引人注目,在于它们之间形成了如此工整的呼应。Agent 会创造更多的推理需求——更多的调用、更长的链路,以及更严格的延迟要求。
- Meta 的动作瞄准了需求侧,重点是在其应用内创造更多高价值的 Agent 会话。
- NVIDIA 的动作瞄准了供给侧,重点是以更低成本、更高速度来提供 token。
如果你想为 2026 找一个主题,那就是这一点:赢家不会是拥有最聪明模型的公司,而是那些能够以足够低的成本运行模型,并将其足够深度地嵌入日常场景、真正产生价值的公司。
推理与智能体不再是相邻的叙事,而是同一个故事,只是从技术栈的两端讲述。
如果这一年是这样收官的,那么 2026 年恐怕不会平静。