物理人工智能：为什么是现在以及有何不同？

在 Bessemer 机器人日与 Dyna 的 Jason Ma、xDOF 的 Philipp Wu 和 Perceptron 的 Armen Aghajanyan 讨论机器人研究的前沿

物理人工智能上周成为焦点，从 NVIDIA 的 GTC（在 Jensen 的主题演讲中包括 Olaf 机器人客串）到 Bessemer 机器人日到 Unitree 的 IPO 消息。势头并没有就此止步：本周带来了亚马逊收购 Fauna Robotics 的消息以及人形机器人出现在白宫！

资料来源：摩根士丹利，“机器人年鉴第 1 卷”（2025 年 12 月）

物理人工智能无疑正在蓬勃发展，该领域的风险投资最近也出现了有意义的增长（上图）。正如我在 2026 年预测文章中所写，实体人工智能竞赛可能比 LLM 战争更加激烈和重要。

资料来源：Bessemer Venture Partners，“智能机器人：物理人工智能的新时代”(11/4/25)

但机器人技术并不总是一个“热门”类别，许多投资者仍然保留着之前周期的疤痕组织（上图）。那么这次到底有什么不同呢？关键的转变是今天的物理人工智能催化剂并不是按顺序展开的。相反，它们并行复合，创造出一种融合，使这一刻感觉从根本上不同于之前的时刻：

物理 AI 基础模型正在迅速发展： 专为物理世界构建的新型 AI 模型正在出现，从视觉-语言-动作模型到自动驾驶模型再到世界模型（请查看 Chris Paxton“>深入探讨这个主题。实际上，我们现在看到了机器人技术“基础模型层”的开始，有可能解锁能够跨任务、环境和外形因素进行思考和推理的“机器人大脑”。这是对依赖于脆弱规则或训练有素且不可推广的政策的传统方法的阶跃函数改进。
数据瓶颈正在缓解： 多年来，机器人技术前沿的限制因素不是智能；而是智能。这是数据。与法学硕士不同，训练机器人模型所需的数据（例如运动技能、压力、操作等）不能只是从互联网上废弃。物理人工智能数据是非结构化的、多模式的，并且历来昂贵且通过现实世界的交互收集缓慢。然而，由于可扩展远程操作、模拟优先方法、以自我为中心的视频、世界模型和触觉的进步，这些数据限制现在正在减弱。此外，技术和工具也在迅速成熟（如下所示）。数据问题还没有完全解决，但它不再是以前的墙了。

推理基础设施正在满足这一时刻： 机器人智能只有在机器人可以实时采取行动时才有用。在这里，边缘推理方面的突破，例如可以在本地实时运行复杂模型的更高效的设备上计算，正在缩小差距。这种类型的推理对于物理人工智能系统至关重要，因为延迟和连接可能会带来严格的限制，特别是在工厂车间或建筑工地等需要立即采取行动的环境中。
硬件已准备好扩展并变得更便宜： 至关重要的是，硬件改进、商品化和成本曲线下降使可扩展、多功能的机器人在经济上可行。这是将有前途的演示转变为可部署产品的必要解锁。
宏观经济顺风： 这些技术转变正在有利的宏观环境中汇聚。劳动力短缺、供应链脆弱以及围绕回流等问题的地缘政治压力，使自动化从未来的赌注转变为当前的战略必要性。与此同时，从道路上的自动驾驶汽车到餐馆里为顾客提供服务的人形机器人，自主性正日益成为公众意识的主流。
人才流入： 也许最明显的信号就是人才。在大型科技公司和初创公司中，一波研究人员、开发人员和创始人正在进入机器人领域，其数量让人想起法学硕士热潮的早期：

来源：Lazard，“机器人——下一波浪潮”（2025 年 9 月）

虽然该领域最近取得了显着的进展，但更大的争论已经转移到时间上：物理人工智能何时会拥有“ChatGPT时刻”？我们还没有真正达到大规模现实世界任务的普遍适用性，但随着多种催化剂并行复合，轨迹变得越来越清晰，拐点可能比我们预期的更接近。

了解 RecodeX 的更多信息