返回首页
2026.04.20 05:22 约 17 分钟 具身智能

Bessemer 预测:机器人技术与物理 AI

关于 2026 年机器人研究现状与物理 AI 生态商业化的六大投资人预测——以及创始人对市场演进的坦率观点

没有人真正想做高度重复的体力工作,也没有人愿意在工厂或危险场所中忍受不安全的工作条件。这一观察听起来简单,但其影响并不简单。美国、欧洲、日本和中国的人口结构趋势正在为机器人解决方案构建结构性的、持久的需求——这种需求独立于任何单一技术周期而存在。一些分析师预测机器人市场将在 2035 年达到 380 亿美元——而高盛自身在一年内就将这一预测上调了六倍。我们认为,无论是节奏还是规模,这一估计仍然偏保守。

“在未来 10–20 年里,地球上的机器人数量将增加 10 万倍。”

—— Jeremy Levine,Bessemer Venture Partners 合伙人

在 Bessemer,我们经常在看到三股力量交汇时投资新品类:人才迁移、技术突破和结构性顺风。在机器人和物理 AI 领域,这三者正在同时加速。我们已经投资了一些突破性团队,投资组合涵盖软件、整机系统和基础模型:WaymoMind RoboticsFoxgloveBreakerNodaVoxel51DroneDeployAuterionPerceptronANYbotics。但我们才刚刚开始,尤其在我们识别出在该领域构建的前 50 家初创公司之后。以下是塑造我们 2026 年投资活动的六项预测——以及塑造我们对前景看法的创始人观点。

Title

一览:2026 年机器人和物理 AI 的六大预测

  1. 我们正处于机器人领域的 GPT-2.5 时刻。能力是真实的,但实验室表现与现场部署之间的差距仍然很大。
  2. 缩放定律正在显现。数据成本高昂,资本是护城河。世界模型可能是捷径。
  3. 人才集中度将迅速决定赢家。这不是一个 50 家公司都能赢的市场。
  4. 近期价值将由全栈、垂直整合的玩家获取,而非纯基础模型公司。
  5. 国防机器人将产生该品类首批 500 亿美元以上的 IPO
  6. 不会有机器人泡沫。事实上,流入该行业的资本远远不够。

感谢以下创始人和专家在本报告中分享他们对市场的看法:Armen Aghajanyan(Perceptron 联合创始人兼 CEO)、Ian Glow(Zeromatter CEO)、Brian Moore(Voxel51 CEO 兼创始人)、Mike Winn(DroneDeploy CEO 兼联合创始人)、Lisa Yan(Argus Systems 创始人)、Adrian Macneil(Foxglove 联合创始人兼 CEO)、Matthew Buffa(Breaker 联合创始人)、Nikita Rudin(Flexion CEO 兼创始人)、Mahesh Krishnamurthi(Vayu Robotics 联合创始人)、Brad Porter(Cobot CEO 兼创始人)和 Philipp Wu(隐身机器人公司联合创始人)。请继续阅读以了解更多。

we’re in the chatgpt 2.5

预测 1:机器人的 ChatGPT 时刻即将到来,但我们尚未抵达

机器人行业正处于其 GPT-2.5 时刻:基础模型展示出真实的能力,缩放定律开始浮现,但实验室演示与生产部署之间的差距仍然很大。

机器人正处在一个类似的时刻。演示是真实的。底层模型在改进。定义 LLM 时代的缩放定律开始在机器人数据中显现。但在物理世界中实现通用化、可靠的部署?这仍是未来的事。

但进展是清晰的。Physical Intelligence 的 π0 模型以人类水平的灵巧度从洗衣篮中折叠衣物。2026 年 2 月发布的 EgoScale 论文显示,策略性能随预训练数据规模可预测地扩展——这是机器人基础模型遵循定义 LLM 的同一数据驱动改进曲线的首个有力证据。这些不是渐进式的成果,而是表明该领域已跨入能力的新阶段。

但仍有两个棘手的问题悬而未决:缩小实验室性能与生产部署所需的 99.9% 可靠性阈值之间的差距,需要多少数据、什么类型的数据?以及当机器人的 ChatGPT 时刻到来时,它实际上会是什么样?

与聊天机器人不同,能力无法通过文本框来证明。证明点必须是视觉的、物理的、不容置疑的:一个机器人在陌生环境中执行复杂任务,无需人为干预。我们认为这一时刻并不遥远,但它还没有到来。

已经到来的是:实用的、狭窄的应用正在产生真实的商业回报。仓储自动化、手术辅助、最后一公里配送、工业检测——这些都不在等待通用化的时刻。在受限环境中运行的专用系统现在就在产生收入,而可靠性的门槛在今天就可以达到。

“通向真实世界机器人技术的道路不是更好的控制算法——而是更好的、能理解物理世界的基础模型:能看见、能推理空间和物理、能预测接下来应该发生什么的模型。机器人控制成为顶上的一个薄层。收集机器人演示并微调策略的公司可以解决狭窄任务,但它们无法扩展。基础才是关键。”

—— Armen Aghajanyan,Perceptron 联合创始人兼 CEO

要走到那个通用化时刻,需要解决一个比模型本身更难的问题:数据。

预测 2:缩放定律正在显现。数据昂贵,资本是护城河——世界模型可能是捷径。

机器人数据比互联网文本稀缺数个数量级——而弥合这一差距所需的资本规模,将迅速将资金充裕者与其他人区分开来。

LLM 时代有一个机器人不具备的根本优势:互联网。语言模型在数百万亿可免费获取的文本 token 上自举。物理 AI 没有等价的语料库。全球机器人操控数据总量估计约为 30 万小时——相比之下,互联网视频约为 10 亿小时,文本约为 300 万亿 token。差距不是渐进的,而是结构性的。

成本影响是直接的。Bessemer 估计,未来两年行业累计的机器人数据成本将超过 30 亿美元,涵盖遥操作、第一人称视频、仿真和物理演示采集。机器人数据无法被抓取或从经纪商处购买。它必须任务一个一个地、环境一个一个地生成。最快弥合这一差距的团队将是有资本维持这种努力的团队——这与 Waymo 和特斯拉在自动驾驶中获得的结构性优势相同,那里的数据护城河建立在里程和边缘案例上,而不仅仅是算法上。

“仅靠遥操作不会成为成功的数据策略。你应该从互联网或仿真器中通过强化学习获取数据——仅靠遥操作你永远无法获得所需的规模和多样性。”

—— Ian Glow,Zeromatter CEO

减少对昂贵真实世界采集依赖有两条部分路径。第一条是世界模型——在互联网级视频上训练、通过观察学习物理的神经网络。结果令人鼓舞:Meta 的 V-JEPA 2 在超过百万小时的互联网视频上训练,仅用 62 小时的额外机器人专用数据就在真实机械臂上实现了 80% 的零样本拾取-放置成功率。但世界模型本身训练成本高昂——NVIDIA 的 Cosmos 在三个月内需要 1 万张 H100 GPU。这不是免费的捷径。这是一个资本密集型的赌注,赌从视频中学到的物理可以泛化到物理操控。早期结果令人鼓舞;完全泛化仍未被证明。

第二条路径是仿真和强化学习。Sim-to-real 迁移在运动方面效果不错,但操控更难。机器人手如何与软物体交互、织物如何在手指间滑动、液体如何运动——这些都需要当前仿真器无法达到的保真度。操控的 sim-to-real 是一个开放的研究问题,而非已解决的问题。

数据基础设施不是后台职能,而是核心竞争优势。

“在物理 AI 中将领先者与炒作分开的是这一点:他们不追求规模,他们痴迷于数据质量。当你构建在物理世界中运行的系统时,糟糕的数据不仅是低效的——它是危险的。决定性的优势将属于拥有最强数据飞轮的公司,他们能比所有人更快地将机器人数据转化为更好的决策、更好的模型改进和更好的部署。”

—— Brian Moore,Voxel51 CEO 兼创始人

构建那个飞轮的团队都有一个共同点:合适的人才。而那个人才池非常小。

预测 3:人才集中将迅速决定赢家——这不是一个 50 家公司都能赢的市场

在过去五年成立、融资 3000 万美元以上的美国机器人公司中,43% 的创始人拥有博士学位。近一半(48%)来自仅四所机构:斯坦福、MIT、伯克利和卡内基梅隆大学。56% 的这类公司至少有一位博士联合创始人,43% 直接来自学术界。机器人没有广泛的人才生态系统。它是一个狭窄的管道,产出少量极具能力的人,而这些人已经在选边站队。

机器人领域的人才护城河将比大多数人预期的更快地复合为赢家通吃的动态。人才不仅吸引更多人才,也吸引资本,进而吸引数据合作、客户关系,以及生成专有数据集的基础设施。每一项优势都会复合下一项。

这种动态在 LLM 中也上演过,但有一个重要差别:开源部分地民主化了对语言模型能力的访问。Llama 和 Mistral 意味着没有前沿实验室背景的小团队也能在强大的开源权重之上构建。在机器人领域,开源势头是真实的。LeRobot、Genesis 和 Isaac Lab 看到了有意义的下载量增长,但开发者生态面临一个软件中不存在的摩擦:你仍然需要一个机器人。仅靠模型权重无法弥合人才差距。

在 sim-to-real 迁移、操控、运动和传感器融合方面拥有最深专业知识的团队正在构建开源发布难以轻易复制的优势。

团队组成是机器人领域的第一个投资决策,而它在这里比几乎任何地方都复合得更快。这不是一个适度能力的公司长尾找到细分市场并存活下来的市场。资本和人才将迅速集中。鉴于人才如此集中,且通用化模型仍很早期,价值实际上在堆栈中的何处累积?

预测 4:全栈玩家将捕获近期价值——纯基础模型公司需要等待

与 LLM 时代不同——横向基础模型公司在早期捕获了超额价值——机器人基础模型尚未通用到能开箱即用,这给了垂直整合玩家一个有意义的领先优势。

在软件中,API 改变了一切。一旦 GPT-4 可以通过单一端点调用,两人团队就能在第一天构建一个具有前沿 AI 能力的产品。堆栈干净利落地分离了。机器人还不是这样运作的。部署需要特定领域的数据采集、针对目标环境的微调、硬件集成,以及在现场管理机器人的运营基础设施。任务太多样、环境太不可预测、失败模式太严重,通用模型无法在没有大量专门化的情况下处理。

今天构建的护城河主要不在模型架构上——而在专有数据管道、领域专业知识、部署基础设施,以及生成真实世界反馈循环的客户关系中。一家在数十个设施部署了数百台机器人的仓库自动化公司拥有基础模型提供商所没有的东西:数百万小时的任务特定生产数据,持续改进一个已经针对该环境调优的模型。

硬件商品化正在加速这一动态在各个垂直领域的展开。

“硬件成本曲线是企业机器人最终扩展的主要原因。在建筑业,几年前每台 10 万美元的地面机器人现在以低于 1.5 万美元的价格运行同样的工作流。坞站式无人机已从 20 万美元降至 2 万美元以下,同时变得更强大。硬件需要变得足够便宜,部署才能扩展——而我们现在正在跨越那个门槛。”

—— Mike Winn,DroneDeploy CEO 兼联合创始人

这种成本压缩正在重塑价值的累积位置。堆栈分为三层:基础设施层是基础模型和世界模型。应用层有两类:拥有定制硬件的全栈公司——人形机器人、专用工业系统——以及将 AI 应用到商用现成平台上的全栈公司。今天价值正集中在那些应用层,正是因为基础设施层尚未通用到足以独立支持端到端部署。

这种情况会演变。随着基础模型改进和 sim-to-real 迁移成熟,机器人的 API 时刻将到来。朝着那一时刻构建的横向基础模型公司正在做出可能正确的长期赌注——但这可能是 2028 年及以后的故事。在我们运营的这个窗口内,垂直化是创造持久价值的地方。

“物理 AI 的决定性优势将不是模型新颖性,而是其背后数据基础设施的质量。随着模型趋同,赢家将是拥有最强数据飞轮的公司,能比所有人更快地将机器人数据转化为更好的决策、更好的模型改进和更好的部署。”

—— Adrian Macneil,Foxglove 联合创始人兼 CEO

有一个垂直领域比其他任何领域都更快,它将产生该品类首批里程碑式的公开市场结果。

预测 5:国防机器人将驱动该品类首批 500 亿美元以上的 IPO

国防机器人估值已经领先于非国防同行——地缘政治顺风、国家安全紧迫性和政府支持的资本将驱动机器人领域首批里程碑式的公开市场结果。

数据中可见这种差距。2025 年国防机器人公司 A 轮的中位投后估值达到 1.05 亿美元,而非国防为 5000 万美元——这个差距自 2021 年以来每年都在扩大。

Anduril 在 2026 年 3 月以 600 亿美元估值完成融资。同月,Saronic 为自主造船筹集了 17.5 亿美元 D 轮。这些不是异类,而是该品类开始产生定义十年风险投资回报的那种结果的领先指标。

结构性原因很直接。国防采购周期虽然漫长,但可预测——合同规模大、续约率高、转换成本显著。客户既有预算又有规模化部署的紧迫感。与商业机器人不同——企业仔细权衡 ROI 并缓慢行动——国防买家以不同的算计运作:能力差距承载国家安全后果,不行动的代价以战略风险衡量,而不是美元。

地缘政治维度放大了这一点。各国已经得出一个越来越无法忽视的结论:机器人技术从根本上改变了现代战争的性质。2025 年全球售出的人形机器人中近 90% 是中国制造的。

中国 AI 模型平均落后美国模型约七个月——这一差距持续缩小。驱动半导体和卫星投资的同一动态现在正在自主系统中上演,美国政府开始将机器人视为国家安全要务。

值得诚实承认双重用途维度。这一领域最具防御性的公司不是构建单一用途武器系统——他们构建的是具有真正商业应用的自主平台、感知系统和决策基础设施。国防与商业之间的界线并不总是干净的,在这一领域的创始人正在做出关于在哪里划线的真实选择。

“双重用途问题是真实的,它不会消失。这一领域最有趣的公司不是在国防与商业之间做选择——他们构建的系统能力足以满足国防要求,同时碰巧在商业环境中也具有变革性。线在哪里取决于技术、客户以及创始人自己对愿意构建什么的判断。”

—— Matthew Buffa,Breaker 联合创始人

如果国防已经在产生这些结果,为什么仍有这么多观察者称之为泡沫?因为我们认为不存在泡沫。

预测 6:没有机器人泡沫。流入这一领域的钱不够。

每隔几周,一笔融资公告就会引发同样的反应:这肯定太多了。一家人形机器人公司在产品上市前就以十亿美元估值融资。一个国防自主平台关闭的轮次比大多数 C 轮软件公司还大。泡沫叙事自我成立——但它也是错的。

过去五年,745 家软件公司融资超过 3000 万美元。机器人的等价数字是 42——在底层市场比全球软件支出大 30 倍的领域,被资助的公司少 18 倍。即使考虑到硬件业务的资本密集性,相对于其可寻址的机会,机器人在结构上仍然投资不足。看似泡沫的,总体上是流入一个风险投资几十年来资金不足的品类的追赶资本。

增长预测强化了这一点。大多数分析师预测未来十年行业增长 50 倍。我们认为这一估计锚定在自动化现有工作流程上,而没有考虑到能干、通用的机器人将创造的全新经济活动品类。变革性技术不会线性扩展——它会创造此前不存在的市场。

这并不意味着每家被资助的公司都会成功。一些估值被拉伸了。不是每家人形机器人公司都会找到规模化部署的可行路径。正如我们在预测 3 中所论证的,资本将围绕少数领导者整合,而那些没有通过门槛的公司将不会有软着陆。选择性仍然重要。

但选择性不同于稀缺性。机器人投资的整体水平——相对于机会规模和能力发展速度——仍远低于应有水平。在 ChatGPT 时刻到来之前、在人才整合完成之前,支持基础性公司的窗口现在是开放的。等待拐点的证据是错过它的稳妥方式。

“五年后,全球部署的大多数机器人不会由我们今天知道的初创公司制造。它们将由尚未开始制造机器人但知道如何大规模做的公司制造。”

—— Nikita Rudin,Flexion CEO 兼创始人

这就是赌注。未来十年定义物理 AI 的公司现在正在被创立——其中许多还不存在。

机器人和物理 AI 中的差距与开放辩论

上述六项预测反映了我们最有把握的观点。但仍有许多悬而未决的问题将塑造未来三年生态系统的演变。

可靠性差距。从 80% 任务成功率到 99.9% 不是线性问题。最后 20% 需要根本不同的方法——触觉感知、力反馈、更好的操控 sim-to-real 迁移——这比大多数时间表假设的要长。这不是悲观的理由,而是要精确区分哪些问题是工程挑战、哪些需要新科学、基础设施和工具。

“我们远未’解决’机器人中的数据问题。我在 Waymo 的经验告诉我,真实世界部署随着时间推移会发现更难、更专门的数据策划和标注问题。将 99% 与 99.9% 可靠性之间的差距缩小是一段陡峭的爬坡,比大多数人意识到的要长。”

—— Lisa Yan,Argus Systems 联合创始人兼 CEO

推理成本问题世界模型和大型视觉-语言-动作模型在实时运行中代价高昂。与文本模型不同——文本模型在共享基础设施上跨数千并发用户批量处理请求——机器人模型必须每隔几毫秒为每个机器人生成一个环境状态,这意味着每次部署实际上都需要一条专用的 GPU 流水线。我们已经看到推理创新方面的显著进展,LLM 推理成本在三年内下降了约 1000 倍。机器人推理是否遵循类似的曲线、以多快的速度,将决定哪些基础模型方法在大规模上具有商业可行性。我们认为曲线会变陡,但确切时间表尚不清楚。可解释性作为下一个基础设施层。随着资本流入世界模型和大规模基础模型,一类问题正在出现,行业还没有完全应对:这些模型在很大程度上是不透明的,而在失败具有现实世界后果的物理系统中,不透明是不可接受的。

“仅 2026 年第一季度就有约 60 亿美元流入六、七家世界模型公司。随着行业成熟,可解释性变得不容商量。这些模型现在是黑盒。预计将出现一波构建工具来打开它们的初创公司。”

—— Mahesh Krishnamurthi,Vayu Robotics 联合创始人

开源 vs. 闭源。LLM 时代证明了开源可以显著加速生态系统发展并使能力访问民主化。同样的动态是否会在机器人中出现——物理数据和部署基础设施与模型架构和方法同样重要——尚待观察。我们的工作观点:开源将比大多数人预期的更快地商品化模型架构,但数据和部署层将保持专有足够长的时间以发挥作用。理解堆栈中哪些部分要开放、哪些要保护的公司,将比那些不理解的公司拥有有意义的战略优势。

机器人未来的两个真相

最接近这项技术的创始人持有听起来矛盾的观点——而他们都没错。

“机器人的 ChatGPT 时刻比大多数人意识到的来得更快。当它到来时,瓶颈将是生产小时——真实的机器人、真实的工作、真实的环境。优化部署而非演示的公司将与同行决定性地区分开来。”

—— Brad Porter,Cobot CEO 兼创始人

“时间表比大多数人预期的要长得多。通用机器人技术仍在五年以上的距离。”

—— Philipp Wu,隐身机器人公司联合创始人

两者都是对的,但他们描述的是不同的东西。Porter 描述的是通向拐点的路径。ChatGPT 时刻即将到来,定义它的公司将是今天复合真实部署小时的公司。生产速度不是通用化奖励的替代方案;它是你赢得构建它的权利的方式。

Wu 描述的是那个拐点实际上有多远。通用化时刻——单个机器人在没有特定领域微调的情况下跨任务和环境有意义地表现——比大多数时间表假设的更远。研究差距是真实的,资本要求是显著的。

这些不是相互竞争的预测。它们是给创始人的地图:现在果断部署,并将通用化时刻作为你的视野构建。

拐点正在到来。人才正在迁移,硬件正在商品化,数据基础设施正在构建。未来十年定义物理 AI 的公司正在被创立和资助。

了解 RecodeX 的更多信息

立即订阅以继续阅读并访问完整档案。

继续阅读