机器人技术与物理人工智能时代

本文信息来源：chainofthought

现实世界的机器人正在走出实验室。数据鸿沟确实存在，但可以解决。

本周我有了一个深刻的认识：机器人正在到来。

该领域的创始人们不断告诉我们同一件事：这项技术的发展速度远比外界看起来要快得多。技术难题确实存在，但他们认为这些问题只是时间问题，而不是无法克服的障碍。

一旦实现，这个市场的规模可能远超大多数预测。

让我们来看一些早期迹象。

#1：人形机器人正在进入早期量产阶段

人形机器人已经从隐秘开发阶段转向公开试点。像特斯拉、Figure、Agility Robotics、Boston Dynamics 和 Unitree 这样的公司，如今正公开竞赛，致力于打造能够行走、搬运、抓取并在为人类设计的环境中操作的通用系统。

这标志着从特定任务自动化向更灵活的物理智能体的转变，旨在适用于更广泛的现实世界应用场景。

我们建立了一个内部模型，用于追踪工业级人形机器人到2030年在全球范围内的规模化进展。

该预测结合了多种公开信号：特斯拉的产能提升、比亚迪的内部部署、Unitree 和优必选在中国汽车行业的合同，以及瑞银和高盛的中端出货量估算。我们还加入了自己的假设：特斯拉在制造方面步入正轨、行业没有出现重大挫折，以及其他几家企业大致保持进度。

截至 2025 年中期，美国有大约 150 个人形机器人被公开披露并在工厂和仓库的试点项目中投入使用。这些项目包括特斯拉、亚马逊/GXO（Agility Digit）、宝马（Figure-01）、梅赛德斯-奔驰（Apptronik）和 1X NEO 的早期试点。

未来几年将会遵循一个熟悉的模式：

在工厂某一区域成功部署20台机器人进行试点后，就有理由下更大的订单来实现整条生产线的自动化。像宝马这样的初始合作伙伴不会直接从20台机器人跃升到2万台。更合理的下一步是订购100-300台，以在特定领域实现有意义的影响。
到 2026 年，Figure 和 Apptronik 等公司将利用 2025 年的成功案例，与新的大型客户签约，启动他们自己的试点项目（每个新客户再增加约 20-50 台机器人）。
机器人公司将加快其小批量制造能力的提升。虽然还未达到大规模量产，但他们将能够完成数百台的订单，而不仅仅是几十台。
“第一波”效应： 先行者的成功将引发汽车、物流和电子制造等行业的“快速跟随者”公司掀起一波浪潮，纷纷启动自己的试点项目，以避免在竞争中落后。

基于这些信息，我们预测到 2030 年，全球人形机器人数量可能达到 82 万台， 这标志着从概念验证阶段向商业化规模的转变。

#2：经济压力正在推动采用

人形机器人的宏观经济理由非常充分。人类劳动力是全球最大的经济部门，年产值超过30万亿美元。由于出生率下降、移民减少以及主要经济体提前退休，劳动力短缺问题日益加剧。

劳动力变得越来越昂贵且越来越稀缺。这是结构性趋势，而非周期性波动。

在这种背景下，即使只是对体力劳动进行部分自动化，也具有重要的经济意义。能够接管重复性或危险任务的人形机器人，无需新建物理基础设施，就能解决广泛的劳动力缺口。即使最终只有很小一部分任务实现自动化，潜在市场依然巨大。

传统市场研究认为，全球机器人行业在 2024 年约为 820 亿美元，部分预测认为到 2034 年将达到 4480 亿美元。然而，我们认为这些数字很可能低估了行业的真正潜力。正如新兴技术领域常见的情况，早期预测往往低估了市场规模，并忽视了人类创新随着时间推移所能解锁的广泛应用。

我们认为 2034 年的市场规模更接近于 1 万亿美元 ，这意味着仅在本十年内就有超过 9000 亿美元的新机遇。

机器人技术与物理人工智能时代

北极星研究

#3：中国的扩张速度领先全球

中国目前占据了全球工业机器人安装量的多数。2023 至 2024 年间，该国部署了超过 276,000 台新工业机器人，占全球新安装总量的 51%。这一速度没有放缓的迹象。

北京也在以创纪录的规模投资该行业。2025 年 3 月，国家发展和改革委员会（NDRC）启动了一项国家支持的风险投资计划，目标是在未来二十年内筹集高达 1 万亿元人民币（约合 1380 亿美元）的资金。重点领域包括机器人、人工智能和先进制造业。

这比以往任何专门用于机器人领域的国家基金都要大一个数量级，显示出中国在主导下一代工业自动化方面的明确国家战略。

#4：私人资本正在迅速行动

即使在更广泛的市场波动中，机器人领域的私人投资依然保持强劲。2024年，总融资额达到72亿美元。2025年初的数据仅略有下降，且资金仍主要集中在类人系统和物理人工智能平台的高调融资上。

Figure AI 完成了 6.75 亿美元的融资，而 Physical Intelligence 融资 4.7 亿美元。这些并不是边缘性的赌注。投资者正在围绕他们认为已进入执行阶段的机会进行布局。假设很明确：机器人技术的突破已不再是投机性的，而是足够接近现实，值得投入资金。

赌注之所以巨大，是因为奖赏更为丰厚。一旦机器人能够在非结构化环境中移动，并完成如今需要人类才能完成的任务，需求将呈指数级增长，覆盖多个行业、地域和应用场景。

物理图灵测试：拐点

当 ChatGPT 问世时，我们都感受到了它的冲击。它能写作、解释、开玩笑、提供帮助，这些能力让人惊讶地接近人类。那一刻成为了 AI 的转折点。图灵测试被攻克。ChatGPT 成为史上最快达到一亿用户的应用（仅用 2 个月！）

机器人领域还在等待属于自己的那场变革。英伟达的 Dr Jim Fan 为它起了个名字： 物理图灵测试。

想象一下，你为一群大学朋友举办了一场家庭派对后的清晨。昨晚热闹喧嚣，音乐、舞蹈、酒水畅饮。等大家都离开后，只剩下你和一片狼藉：杯子散落在地上，瓶子被打翻，盘子没洗

一切都乱成一团（该死）

机器人能否进入派对结束后的房子，清理杂乱，装好洗碗机，擦拭台面，重新摆放家具，做到让你无法分辨是人类还是机器完成了这些工作？

我让 ChatGPT 清理第一张图片里的杂乱。想象很容易，真正去做却难多了。

即使是在最好的现实世界机器人任务基准——斯坦福的 BEHAVIOR-1K 上，脚本化的“最优”策略在仿真中只完成了 40% 的任务，在真实硬件上仅完成了 22%。现实世界中近一半的失败都源于抓取问题。

仅仅是在杂乱环境中移动就是一项挑战。机器人在杂乱环境中的巡航速度大约为0.5米/秒，仅为人类无意识行走速度1.4米/秒的三分之一。

我们距离通过物理图灵测试还差一个数量级。

第一部分：“通用型”机器人策略的崛起

什么能让我们更接近通过物理图灵测试？

大多数路径最终都指向同一个理念：具备泛化能力的机器人 AI。机器人能够在陌生环境中进行推理、即时适应，并在没有为每一个极端情况都进行硬编码的前提下从错误中恢复。

这不仅仅依赖于巧妙的硬件。它还取决于策略。

在机器人领域，策略就是大脑。它是将感知映射为行动的模型。它根据机器人当前对世界的理解（其状态）来决定下一步该做什么。一个好的策略定义了行为，而一个出色的策略则能应对意外。

传统机器人在结构化环境中表现良好。给它们一个狭窄的任务和固定的设置，它们就能可靠地执行。但现实世界是不稳定的。物体会移动，光线会变化。针对特定任务的系统在这种多变性下会崩溃。

这就是为什么该领域正在推动通用策略的发展：在多样化任务、环境和硬件上训练的模型。这类似于我们在 LLMs 上看到的做法：先进行广泛的预训练，然后针对每个新环境进行轻微微调。目标不是为每一个极端情况都写死规则，而是教授可迁移的物理直觉。

如果一个机器人能够清扫一间公寓后，无需重写其逻辑就能处理下一间公寓，经济格局就会发生变化。硬件固然重要，但智能才成为限制因素。

智能源于多样性。要让机器人真正具备智能，它们必须在我们中间生活和学习。我们需要能够优雅地失败的机器人，这样它们才能从错误中学习。

两种能力使这一切成为可能：适应性和自主性。

适应性是指从经验中学习并进行泛化的能力。如果一个机器人能清洁一个水槽，它能否在不从头开始的情况下搞定另一个？这取决于多样化的经历以及能够持续学习而不遗忘的模型。
自主性指的是无需监督的执行能力 。当机器人进入一个新环境后，它能否在没有人类帮助的情况下端到端地运作？这包括感知、规划、行动以及从失败中恢复。

机器人基础模型旨在编码物理常识：物体如何运动、如何操控它们，以及如何在空间中移动。在此基础上，它们还能通过决定做什么 ，而不仅仅是怎么做 ，来支持更高层次的推理。

像 Physical Intelligence 和 SKILD.AI 这样的公司正凭借大量资金追逐这一愿景。他们的方法围绕一个简单的理念：扩大数据规模，模型就能实现泛化。

数据瓶颈

机器人技术与物理人工智能时代

来源：Coatue

但问题在于，物理 AI 面临的数据难题远比数字 AI 陡峭得多。

机器人不像软件那样可以大规模扩展。反馈循环既慢又昂贵。你无法每小时迭代上千次。每一次交互都会消耗硬件。机械部件会磨损。没有人愿意让一个机器人保姆在自家客厅里通过反复试错来学习。

与训练于数万亿单词的 LLMs 不同，机器人通过多模态体验来学习：视觉、音频、触觉、力觉、本体感觉，以及在三维环境中的交互。

据一项估计，目前最大型的机器人数据集大约包含 10⁶ 到 10⁷ 个动作样本。与语言或视觉训练中常见的 10¹² 个样本相比，这种不对称性变得非常明显。这足足少了 6 个数量级 （1,000,000 倍）。

快速查看现有的开放数据集，就会发现我们拥有的数据是多么稀少，差距依然如此之大：

数据集	尺寸/详情
开放式 X-Embodiment 数据集	超过100万条轨迹，22种机器人类型，527项技能
DROID（分布式机器人交互数据集）	76,000条轨迹，350小时数据，
Ego4D	3700多小时的感知视频数据
Dex1B	10亿个用于灵巧手任务的合成演示
地球漫游者 2K（Frodobots）	来自10多个城市的2000小时远程操控人行道机器人驾驶数据

此外，由于该领域仍处于起步阶段，能够使用的高性能机器人数量有限， 全球范围内真正懂得如何高效准备和使用复杂机器人数据集的人可能只有几千人。

机器人数据的两种方法

A. 仿真

机器人技术与物理人工智能时代

来源：Jim Fan 博士在 Sequoia AI Ascent 的演讲

核心思想是：

如果一个机器人已经处理过1,000,000种不同的环境，那么它在第1,000,001种环境中表现良好的概率也很高。

仿真是机器人在不受损的情况下学习的方法。只有在仿真中，机器才能摔倒一千次后依然能站起来。在仿真中，机器人可以以快于实时的速度训练，遇到罕见或危险的极端情况，并探索那些在物理硬件上测试过于缓慢、危险或昂贵的动作。

仿真为我们提供了一种倍增稀缺现实世界数据的方法。一次演示可以在 N 个环境和 M 种动作变化中重复播放，生成 N × M 个新样本。

随着神经世界模型和模拟器的进步，一种新的扩展法则正在出现：物理智商随着所用算力的增加而提升。更多算力=更强大的策略和更智能的机器人。

这就是我们的扩展方式。

机器人技术与物理人工智能时代

来源：Jim Fan 博士在 Sequoia AI Ascent 的演讲

但仿真有其局限性。它在无人机和基础运动方面效果不错，因为这些物理过程相对简单。而操作则更难。摩擦力、接触动力学以及精细的传感都很难被准确建模。

而最大的挑战，是将仿真中的成功转化为现实世界中的实际表现：我们称之为“ 仿真到现实的鸿沟（sim-to-real gap）”。

问题出在两个 P 的交汇处：物理与感知。

即使是最先进的模拟器也会简化接触、摩擦和变形。表面表现得过于可预测。视觉场景缺乏真实光线、纹理和传感器噪声的混乱。一套在模拟中表现良好的策略，可能会因为抓地力不对或镜面反光欺骗了摄像头，而在真实的厨房地板上失误。

为了弥合这一差距，研究人员依赖于领域随机化（在各种略有扭曲的条件下训练，以增强鲁棒性）和领域自适应（让模拟输入看起来更像真实世界）等技术。有些人则完全闭环：在模拟中训练，在现实世界中部署，收集失败案例，重新训练，如此反复。

弥合这一差距不仅仅需要一种解决方案。它需要更高精度的物理建模、激进的视觉随机化、少量但精准的真实世界数据，以及持续的适应能力。

仿真永远无法取代现实。但它能让我们更快地到达目的地。

B. 真实世界数据

为了可靠运行，物理人工智能需要多样化的真实世界数据，以捕捉极端情况和不可预测性。而这些都是模拟器难以很好建模的。

有三种最重要的真实世界数据类型。每一种都反映了问题的不同方面。

1. 多模态传感器数据（交互 + 感知）

为了让机器人能够精确行动，它需要知道两件事：它自身的位置，以及周围的环境。这意味着要将来自自身的信号与来自外部世界的信号结合起来。

本体感觉（内部状态）：

这是机器人对自身的感知。关节角度、电机速度、扭矩和加速度都会被实时记录。

编码器和电位计在每个关节处跟踪运动。
惯性测量单元能够感知平衡和运动的变化。
力传感器可以检测抓握是牢固还是滑脱，脚步是落地还是失败。

外感知（外部感知）：

这是机器人观察和触摸世界的方式。

摄像头为物体识别提供了丰富的视觉信息，而激光雷达则捕捉环境的三维结构，从而实现导航和避障。
手指和手掌上的触觉传感器可以测量接触、压力和纹理。最近的进展，如 F-TAC Hand，已经实现了接近人类水平的灵敏度，在手部表面 70%的区域内空间分辨率达到 0.1 毫米。
麦克风则增加了另一层感知：玻璃碰撞的声音或门关闭的声音可以提示视野之外的事件。

每个传感器都能弥补其他传感器留下的空白。它们共同为机器人提供了环境上下文。多模态融合，即将不同类型的数据叠加到一个工作模型中，使机器人能够决定下一步该做什么。

2. 人类示范与远程操作

教会机器人新技能最快的方法依然是最古老的方法：示范给它看。

模仿学习（LfD），即机器人通过观察人类来学习，比起试错式的强化学习要高效得多。机器人不需要从零开始探索规则，而是从一个示例出发。

最新研究表明，精心构建的示范数据集结合有监督或混合算法，仅需几十到几百次真实世界的训练回合就能获得有竞争力的策略，而纯强化学习（RL）从零开始、没有示范的情况下，通常需要一万到一百万次以上的模拟和艰难的现实迁移。

远程操作是最常见的示范方法。人类远程控制机器人，生成高质量的运动数据。接口多种多样（如 VR 头显、动作捕捉服等），但核心思想相同：人类执行任务，机器人观察并学习。远程操作是让机器人在某项任务上获得非零成功概率的最简单方法，然后再在此基础上不断改进。

动力教学则采取了更直接的方式。人类不是远程控制，而是亲自带动机器人的肢体完成动作。

机器人技术与物理人工智能时代

特斯拉的远程操作团队。来源：Electrek

一些团队正在通过众包来实现这一点的规模化。

Reborn 销售一款价格实惠的 Rebocap 动作捕捉服（目前已发货 8,000 套），并将其与虚拟现实游戏相结合，实时标注每一个动作。现在每月约有 200,000 人玩这些游戏，将他们的动作转化为高质量的训练数据。
NRN Agents 使用基于网页的模拟器。玩家通过简单的控制引导机器人完成任务，无需特殊设备即可创造有用的运动轨迹。
Tesla 正在招聘操作员穿戴捕捉服，为其 Optimus 机器人表演特定行为。人类动作会被直接传输到训练流程中。

尽管具有强大能力，LfD 仍面临重大障碍。高质量远程操作硬件的成本（VR 和动作捕捉服的价格已降至 1000 美元以下，但高精度动力学设备仍需 1 万美元以上）以及数据采集的后勤挑战都非常巨大。

此外，“对应问题”——即如何将人体的动作映射到具有不同物理特性的机器人上——仍然是一个关键的研究领域。

3. 带有运动学标签的标注视频

人们很容易认为机器人可以从 YouTube 上学习。毕竟，互联网上充满了人们做各种事情的视频：切菜、叠衣服、修自行车。但其中大部分都毫无用处。

为什么？因为仅有视频并不能告诉机器人事情是如何完成的。它需要知道每个关节和工具在三维空间中的位置随时间的变化。

研究人员正在通过将原始视频转化为结构化训练数据来缩小这一差距。

一些项目使用动作追踪器或增强现实标记，在录制视频时将运动学数据嵌入其中。机器人不仅仅是观察像素，而是能够看到位置、旋转和轨迹。
在华盛顿大学 ， 统一世界模型项目通过学习表征并从视频中推断可能的动作，从带标签的机器人动作和无标签的视频片段中进行学习。在模拟实验中，UWM 的表现优于标准的模仿学习模型。
另一个工具，URDFormer，可以通过一张图片重建出完整的可用于仿真的场景。

机器人技术与物理人工智能时代

来源：URDFormer

最有效的策略是将仿真与现实世界数据相结合。仿真具有规模优势：可以进行数十亿次交互、快速迭代，并且错误不会带来风险。但正是现实世界让模型保持扎根。现实世界会暴露极端情况，打破那些在仿真中从未出现过的假设。

在实际操作中，机器人技术很可能会遵循 Waymo 在自动驾驶领域所采取的类似路径：在虚拟环境中行驶数十亿英里，同时也在真实道路上行驶数百万英里。想象一下，一支分布式的实体机器人舰队，每台机器人都在收集数据，并将其反馈到一个共享模型中。即使是部分自主能力，只要分布在足够多的机器上，也能成为推动学习的强大飞轮。

🗺️ 世界模型与机器人

为了让机器人在实验室外安全高效地运行，仅仅做出反应还不够。它们需要具备预见能力。这正是世界模型发挥作用的地方。世界模型是一种通过学习获得的模拟器，让机器人在采取行动前能够想象其后果。

世界模型能够预测结果（例如，“如果我推杯子，它可能会洒出来”）。
策略则利用这些预测来选择最佳行动（例如，“改为把杯子提起来”）。

与依赖手工编写物理规则的传统模拟器不同，世界模型是通过经验训练出来的。给定机器人的当前状态和一个拟议动作，模型会预测最有可能出现的下一个状态。无需为每一个接触力或摩擦系数进行详细设定，系统能够从数据中隐式学习动力学。

一旦经过训练，一个优秀的世界模型可以快速且安全地模拟成千上万种可能的未来。这意味着学习速度更快，损坏的零件更少（这总是件好事）。

Google 的 Dreamer 展示了世界模型实际上是可行的。它仅通过数小时的真实世界交互就学会了控制策略。关键在于将传感器输入压缩到潜在空间，在这种压缩形式下进行前向预测，并只在需要时解码。这让整个过程高效得多。

世界模型正朝着三个主要方向分化：

仅潜变量模型 （Dreamer，RoboDreamer）完全在压缩表示空间中运行。它们速度快且易于扩展，在干净的环境中表现良好。但在处理混乱的物理环境时仍然存在困难。
神经-物理混合模型试图通过增加一些结构来解决这个问题。这些模型将学习到的模式与已知的物理规律（如刚体动力学或动量）相结合。这有助于处理涉及接触的任务，比如拾取或推动物体。但对于任何柔软、易变或不可预测的事物，它们仍然很难应对。
动态数字孪生采用了一种更为实际的方法。它们将模型视为一个不断根据真实传感器数据更新的活系统。这使得预测在当下更加准确，尤其是在稳定的环境中。但这也带来了代价。这些系统需要大量的传感和计算能力来保持最新。

与此同时，视觉模型正从另一个角度切入。像 Sora、Pika、Runway 这样的生成式视频系统并不理解物理（即对摩擦、质量或接触没有真正的把握），但它们可以猜测下一个合理的画面应该是什么样子。

研究人员已经开始让这些模型以动作为条件，要求它们预测视觉上的未来。结果往往看起来很逼真，但物体仍然会漂浮、消失或表现得不真实。即便如此，这些模型在训练感知系统、模拟罕见的极端情况以及生成合成数据方面已经证明很有用。

但仍然存在重大挑战。我们还不知道如何评估感知接触的预测、在不确定性下进行规划，或在不同机器人本体之间泛化动力学。

第二部分：加密与机器人

到目前为止，我们还没有谈到加密货币。其实我们还可以继续深入探讨，而无需涉及它。

但如果你想知道区块链在机器人领域究竟可能发挥什么作用 ，那么接下来就变得有趣了。

在我们看来，有两个关键领域。

#1：协调并加速大规模数据生成。

我们已经明确，机器人技术需要大量多样且高质量的数据。每一个新任务或新环境都需要缓慢且昂贵的训练过程。

加密技术提供了一种可能的扩展方式：激励机制对齐。我们不再仅仅依赖实验室或公司来收集数据，而是可以通过奖励用户操作机器人或贡献有用的训练轨迹来实现。像“开车赚取”或“清洁赚取”这样的概念，是该领域的早期实验。如果这些循环被证明是可靠的，它们可以实现分布式机器人车队——小型机器人递送包裹、监测农作物或清洁公共空间——同时被动收集数据以改进共享模型。

这正契合了我们几周前在《数据网络》一文中所写的更广泛转变：

“销售原始数据是一项利润率较低的业务，并且很快会变成同质化竞争。真正的杠杆效应来自于在其基础上进行构建（应用、模型）”

#2：治理

“开放、安全、可治理的机器人”这一理念非常有力。我们已经在许多好莱坞电影中看到过机器人如何与人类对抗并试图接管世界。

随着机器人承担越来越多的责任，问题变成了：谁来决定它们被允许做什么？

一个答案是链上治理。区块链可以为机器人政策提供一个透明、防篡改的真实来源。想象一下，一个行为规则的共享注册表（例如：始终与人类保持1米距离），在链上发布，任何人都可以审计或提出更改建议。这种治理方式从专有代码库转向开放协议，减少了碎片化和黑箱行为。

像 OpenMind 这样的初创公司正在探索这一愿景：类似于机器人领域的 Android 系统，但由集体共同治理。以太坊上的提案，如 ERC-7777，代表了将交互标准直接编码进合约的早期尝试。

安全性也是这个故事的一部分。通过加密访问控制和日志记录，机器人可以被编程为验证指令、拒绝未经授权的命令，并且只有在权限核查通过时才执行任务。每一个动作都会留下痕迹。这种透明性让协作更加安全，也更容易发现故障模式。

展望未来，在区块链上的协作变得非常有趣。

当机器人需要连接和协作时：

没有单个机器人拥有所有信息
多个机器人必须实时协同工作
资源（技能、模型、传感器）被共享或货币化
信任与责任需要实现规模化

如今，这种协调通常依赖于中心化服务。区块链为智能体之间的互动、交易和行为验证提供了一个中立层，无需依赖中央权威。这有望让大量自主系统（如无人机、配送机器人、仓库车队）基于共享状态进行通信并调整行为。

每个机器人都将拥有可验证的身份。微支付可以让机器人为电力、数据或模型访问付费。智能合约将使它们能够即时交易服务并强制执行协议。如果做得正确，这些系统可以实现大规模自组织。

值得关注的新兴初创公司

一些初创公司正在将机器人技术与区块链结合起来，将真正的产品和试点项目推向市场。

1. Frodobots 与 BitRobot

如果你想了解加密激励和游戏化如何与现实世界机器人相结合，Frodobots 是一个很好的起点。其设置很简单：小型四轮机器人被部署在城市人行道上，由全球用户远程操控。用户通过驾驶可以获得代币奖励。

其旗舰产品，Earth Rovers，是一款现实世界的寻宝游戏，玩家通过浏览器界面操控人行道机器人。这些有趣的远程操作会产生数据集（例如，一个 2,000 小时的开源城市驾驶数据集），用于 AI 训练。FrodoBots 已在全球多个城市部署了数百台机器人，并计划推出如 Octo Arms 这样的新产品——一款机器人手臂解谜游戏，以扩展数据覆盖范围。

同一个团队还筹集了 800 万美元资金，在 Solana 上构建 BitRobot，一个“面向机器人技术的 Bittensor”。每个子网都将作为一个开放挑战运行。贡献者提交模型或数据，并获得代币奖励，以鼓励参与和持续改进。

阅读我们对 FrodoBots 和 BitRobot 的深度解析请点击这里 。

2. Reborn Network

Reborn Network 由 Luffy Yu 和来自康奈尔大学、加州大学伯克利分校以及哈佛大学的研究团队于 2022 年创立，正在构建一个去中心化平台，通过众包的人体动作数据来训练通用人形机器人。公司总部位于香港，其愿景是通过社区驱动的 AI 模型经济实现机器人技术的民主化：“人民的 AGI 机器人，由人民创造，为人民服务。”

机器人技术与物理人工智能时代

ReboCap 的零售价为 200 美元

平台的核心是 ReboCap™，这是一款低成本的动作捕捉可穿戴设备，用户可以通过它记录并贡献真实世界的人体运动数据。已发货超过 8,000 台，支持 20 万用户。这些贡献将被用于机器人基础模型（RFM）的训练。

配套工具包括 Reboverse——一个仿真与训练环境，以及一个模型库，开发者可以在其中部署或重混训练好的机器人行为。该系统被设计为可通证化。贡献者最终将因提供运动数据而获得 Reborn 通证，而机器人公司则会使用该通证来访问模型或委托训练，从而形成一个与链上参与相关的双向激励循环。

Reborn 已经通过与 Unitree、Swiss-Mile 和 Agile Robots 等公司的合作，在实际场景中试点其模型，目标应用包括仓储、移动和医疗保健。随着中国人形机器人市场的快速扩展，该公司具备良好的规模化发展优势。

在尚未发行代币的阶段，Reborn 已通过产品采纳和不断壮大的开发者生态系统取得了实质性进展。它的目标是成为物理 AI 的开放数据层。

3. PrismaX

PrismaX 是一家位于旧金山的机器人基础设施初创公司，由 AI 机器人专家 Bayley Wang 和区块链开发者 Chyna Qu 创立。公司获得了 a16z Crypto、斯坦福区块链基金和 Symbolic Capital 的支持，已筹集 1100 万美元种子轮资金，用于构建现实世界机器人去中心化的数据与控制层。

PrismaX 平台运行在三个层面：

数据协议 ，用于验证视觉和传感器的贡献并奖励参与者。
远程操作网络 ，按需协调人类操作员，并通过智能合约支付报酬。
AI 基础模型 ，在这些新数据的训练下，逐步减少对人工控制的依赖。

这些组件共同形成了一个反馈循环。远程操作员生成带标签的交互数据，从而提升模型性能，进而减少对人工输入的需求。

PrismaX 的基于代币的系统允许数据贡献者保留其数据帮助训练的 AI 模型中的经济权益。这种模式类似于机器人领域的“数据 DAO”，使用户与开发者的激励保持一致。

该平台还提供即插即用的远程操作工具，使小型机器人公司更容易集成远程控制并扩大部署规模。

目标市场包括仓库自动化、自动驾驶车辆、无人机系统以及医疗和酒店行业的机器人服务。PrismaX 对中型机器人公司和认证的零工工作者尤其具有吸引力，为远程操作员开辟了新的收入渠道。

4. OpenMind

OpenMind 由斯坦福大学教授 Jan Liphardt 于 2024 年创立，正在为自主机器人开发去中心化操作系统和信任层。该团队总部位于旧金山，并在 2025 年 Coinbase AI 黑客松上推出了其平台。

该平台以两个核心组件为中心：

OM1，一个开源的智能体框架，集成了模块化的 AI 系统——包括感知、规划和用于自然交互的语言模型。
FABRIC，一个基于区块链的协调层，通过智能合约实现机器之间安全、可审计的协作。

这些工具共同使自主系统能够组建团队、协商任务，并在共享且透明的规则下运行。

OpenMind 专注于对齐性和问责制。通过将机器人行为、权限和政策编码在链上，该系统让开发者和用户能够审计机器人被允许做什么，以及原因。这在国防、养老和公共服务等对可追溯性要求较高的敏感领域尤为重要。

该平台还支持跨系统通信，例如，通过像 DIMO 这样的数据共享网络连接车辆和服务机器人。

OpenMind 从开源工具起步，计划通过企业服务、FABRIC 基础设施以及未来可能支持机器对机器交易的原生代币实现盈利。

如果被广泛采用，OpenMind 有望成为自主协作的协议层，在各行业和地区建立共享的行为标准。

5. NRN Agent Robotics

NRN Robotics 由总部位于多伦多的 ArenaX Labs 打造，将 Web3、AI 和机器人技术结合，打造了一个用于训练和部署智能体的竞技平台。ArenaX 由 Brandon Da Silva 和 Wei Xie 于 2021 年创立，最初推出了 AI Arena，这是一款基于 NFT 的格斗游戏，用户可以通过模仿学习和强化学习来训练智能体。该初创公司获得了包括 Paradigm 和 Framework Ventures 在内的投资者共 1100 万美元的支持，之后已扩展到实体机器人领域。

前提是让 AI 训练成为一个公开、参与性强的过程，更接近于一项运动。玩家通过游戏玩法训练智能体。这些智能体成为加密原生资产，最成功的智能体可以将其技能转移到现实世界中。

使用 NRN 的 SDK，开发者可以收集真实世界数据，模拟行为，并通过仿真到现实的工作流程将策略移植到物理系统中。他们的 RME-1 机械臂演示展示了通过浏览器游戏学习到的策略可以部署到真实硬件上。

NRN 机器人公司目前正在打造实体竞赛（无人机竞速、人形机器人对战），每项赛事都由加密激励支持。其结果是一个去中心化的训练流程，在开放环境中不断进化物理智能体。

结论

我再说一遍，机器人正在到来。

真正棘手的挑战将是社会和经济层面。人们会接受机器人进入家庭、工作场所和公共空间吗？公司能否找到能够证明高昂前期成本合理性的商业模式？

目前， 人形机器人很像 2013 年的电动汽车 。价格昂贵，能力有限，仍然属于小众。很可能会经历同样的循环。成本会下降，性能提升的速度会超出预期。某个时刻，会有一款产品出现，激发公众的想象力：一个“ChatGPT 时刻”，引发采用的快速转变。

机器人和加密货币看起来可能是奇怪的搭档，但它们的交汇点正变得越来越不可避免，而非仅仅是投机。机器人需要更好的数据、全新的融资模式和无需信任的协作。加密货币为这三者都提供了工具：全球激励、共享所有权和可编程治理。首批实验已经在进行中。

加密技术不会“修复”机器人技术。但它或许能加速我们正在构建的未来。

致敬，

Teng Yan

#具身智能 #深度学习

机器人技术与物理人工智能时代

#1：人形机器人正在进入早期量产阶段

#2：经济压力正在推动采用

#3：中国的扩张速度领先全球

#4：私人资本正在迅速行动

物理图灵测试：拐点

第一部分：“通用型”机器人策略的崛起

数据瓶颈

机器人数据的两种方法

A. 仿真

B. 真实世界数据

1. 多模态传感器数据（交互 + 感知）

2. 人类示范与远程操作

3. 带有运动学标签的标注视频

🗺️ 世界模型与机器人

第二部分：加密与机器人

#1：协调并加速大规模数据生成。

#2：治理

值得关注的新兴初创公司

1. Frodobots 与 BitRobot

2. Reborn Network

3. PrismaX

4. OpenMind

5. NRN Agent Robotics

结论

推荐阅读

宇树科技 IPO 招股书拆解：具身智能与机器人市场的真实底牌

大重组：人类指南

共识来得太早

世界正在变重

炮灰：AI 时代的种子前投资

消费乘数 vs. 效率乘数

机器人技术与物理人工智能时代

#1：人形机器人正在进入早期量产阶段

#2：经济压力正在推动采用

#3：中国的扩张速度领先全球

#4：私人资本正在迅速行动

物理图灵测试：拐点

第一部分：“通用型”机器人策略的崛起

数据瓶颈

机器人数据的两种方法

A. 仿真

B. 真实世界数据

1. 多模态传感器数据（交互 + 感知）

2. 人类示范与远程操作

3. 带有运动学标签的标注视频

🗺️ 世界模型与机器人

第二部分：加密与机器人

#1：协调并加速大规模数据生成。

#2：治理

值得关注的新兴初创公司

1. Frodobots 与 BitRobot

2. Reborn Network

3. PrismaX

4. OpenMind

5. NRN Agent Robotics

结论

推荐阅读

宇树科技 IPO 招股书拆解：具身智能与机器人市场的真实底牌

大重组：人类指南

共识来得太早

世界正在变重

炮灰：AI 时代的种子前投资

消费乘数 vs. 效率乘数

了解 RecodeX 的更多信息