OpenMind:机器人界的安卓
本文信息来源:chainofthought
开源堆栈如何将机器人转变为智能代理的全球网络
简·利普哈特(Jan Liphardt)并不是想引人注目。
那是一个阳光明媚的下午,在帕洛阿尔托。他带着孩子们散步。标准的父亲日常。
只不过,他们身边还跟着一个仿人机器人和三只机器狗。
人们停下脚步。手机纷纷被掏出来。一位邻居问他,和这些看起来像科幻电影反派的机器一起散步,他是否会感到紧张。利普哈特只是笑了笑。“它们每天早上都会从以太坊下载自己的规则,” 他说。“你可以自己审计它们。”

敬请期待
我喜欢这一刻,因为它捕捉到了一种不可思议的东西:我们一直认为是“科幻”的东西,如今却变得如此寻常。
斯坦福大学教授简正在构建协调层,这可能让一切成为现实。他是 OpenMind 的创始人, 这是一个开源的机器人操作系统,旨在为机器提供安卓为手机所做的一切。一个通用的接口,一个共享的协议,以及一种大规模实现分布式智能可信赖的方式。
当我与简交谈时,他向我强调,技术发展速度远超大多数人的认知,而商业模式却滞后了。机器人预示着我们未来的方向:它们不仅仅是病毒式传播的 YouTube 短片,而是我们家庭、学校和街道上的日常存在。

未来并不遥远
帕洛阿尔托人行道上的那一幕可能感觉像个特例,但看看旧金山吧。
在短短二十个月内,自动驾驶的 Waymo 汽车悄然占据了 该市四分之一的网约车市场 。
想想看。在不到两年的时间里,全自动驾驶汽车在世界上最繁忙的城市之一,其出行份额从 0% 上升到 27%。这不再是 Beta 测试。这是一个大规模的商业产品。
Waymo 证明了一点:自主机器已经能够与人类同行竞争,在某些情况下甚至超越他们。
在我们早期的机器人学文章 《机器经济理论》 中,我们写道:
人形机器人给人的感觉很像 2013 年的电动汽车 。昂贵、功能有限,而且仍然是小众产品。同样的循环很可能会重演。成本会下降。性能会比预期提高得更快。在某个时刻,一款产品将抓住公众的想象力:一个“ChatGPT 时刻”,引发采用率的快速转变。
但有一个问题。Waymo 只与其他 Waymo 协调。如果把一个 Waymo 放在送货机器人或人形助手旁边,这些系统就无法对话。
孤立问题
今天的每个机器人都是孤独的。内向程度很高(就像我一样)。
你可以花 10 万美元买一个波士顿动力公司的 Spot 机器人,但它仍然不知道如何为 Figure 人形机器人开门。Waymo 可以在旧金山市中心导航,但它无法与等在你路边的送货机器人同步。每台机器都运行自己的操作系统,说自己的方言,遵循自己的规则。
你可能认为这是一个硬件问题。不,这是一个协议问题。
这与互联网在 20 世纪 70 年代遇到的瓶颈如出一辙。计算机功能强大,但却受困于私人网络。在 TCP/IP 将它们连接起来之前,你无法跨系统发送电子邮件或加载网页。
机器人技术正处于与 TCP/IP 出现之前相同的困境。协调失败体现在三个方面:
-
没有通用语言 :从十个供应商那里购买十个机器人,它们之间都无法相互通信。这就像经营一家公司,每个员工都说着不同的语言,并且拒绝学习你的语言。
-
无共享学习 :机器人会一遍又一遍地犯同样的错误。扫地机器人可能学会了如何避开一个棘手的角落,但这个经验却从未传达到同一屋檐下的人形助手。
-
无验证身份 :在开放空间(医院、工厂、学校)中,你不知道一台机器是什么,谁制造了它,或者它是否遵守规则。这是一个安全噩梦。
我们称之为隔离问题 。除非在机器人达到临界数量之前解决这些协调差距,否则混乱是不可避免的。机器将在共享空间中相互碰撞并重复工作。
AI 智能体也存在同样的问题
如果这听起来很熟悉,那确实应该如此。我们已经在软件领域看到了同样的故事上演。
当 AI 代理首次出现时,它们作为独立个体表现出色。它们可以交易代币、运行活动、管理钱包。但真正的突破在于它们开始协同工作。突然之间,你看到成群的代理自发地组建角色:一个负责数据侦察,另一个执行交易,还有一个管理资金。这看起来不再像一个聊天机器人,而更像一个在链上形成的初创公司。
我们仍处于代理群体的早期阶段,但教训显而易见:没有协调的自主性无法扩展。
代理需要共享的协议来处理身份、消息、内存和支付。否则,系统就会陷入混乱。这就是为什么当今许多 AI 代理堆栈都专注于协调基础设施。
我意识到,要让 AI 代理真正有用,它们必须:
-
相互识别 (身份)
-
相互学习 (共享内存和消息传递)
-
相互支付及向其他实体支付 (链上钱包、自主交易)
这正是初创公司和科技公司一直在努力构建的。
机器人是物理延伸 ,延续了同样的故事线。
它们是具身智能体。不同之处在于,这里的失败不仅仅是一次糟糕的交易。它可能意味着一场车祸,一个送货机器人堵塞了消防通道,或者一个人形机器人在错误的医院病房里游荡。因此,如果数字智能体需要一个协调层,那么物理智能体则更需要它。
这就是 OpenMind 正在构建的层
机器人领域缺失的层
我研究过的许多机器人软件初创公司(BitRobot、PrismaX、Reborn 等)都在解决机器人领域的数据瓶颈问题。这是一个巨大的问题和机遇。OpenMind 最初吸引我的是它希望走一条截然不同的道路。
OpenMind 不仅仅是追求更好的数据,它通过为智能机器创建通用的软件层来解决隔离和信任问题。
它正在构建两个相互关联的平台:
-
OM1 → 通用的人工智能原生操作系统,赋予任何机器人大脑。包括感知、推理和自适应行为。
-
FABRIC → 开放的协调和结算层,让机器人能够证明身份、共享知识并安全地相互交易。
它们共同为机器所做的事情,就像安卓系统和 TCP/IP 协议为手机和电脑所做的那样:将互不相连的设备转变为一个生态系统。而时机再好不过了。我们正处于三大技术曲线的交汇点:
-
AI 现在赋予了机器人语言和逻辑能力。LLMs 可以解释任务、规划序列,甚至实时调试机械故障。
-
硬件终于跟上来了。成本正在下降。执行器变得更智能。供应链日趋成熟。
-
加密技术补齐了缺失的信任层。可验证身份。共享状态。自主支付。所有这些都在中立的轨道上运行。

单独来看,这些趋势中的每一个都具有强大的力量。但将它们结合起来,就能解锁一些新事物:能够大规模推理、协作和协调的机器人。
不仅仅是一台智能机器,而是数百万台机器协同运作。
不只是更智能的机器人。 而是联网的机器人。
幕后技术
#1: OM1,通用机器人大脑
OM1 建立在一个简单但反主流的理念之上:机器人技术的未来不会由垂直整合的堆栈赢得,而是由连接这些堆栈的层赢得。
OM1 不在乎你使用什么硬件。它被设计成一个通用操作系统 ,可以在任何机器人上运行,无论是四足机器人、人形机器人还是 TurtleBot。插入它,机器就会获得一个共享的“大脑”,用于感知、推理和行动。
OpenMind 并没有试图构建一个单一的、庞大的机器人基础模型。谢天谢地。
这场游戏已经非常拥挤,每隔几个月就有新模型发布,每个模型都具有更敏锐的推理能力和多模态感知能力。正面竞争将是一场必败之战。相反,OM1 依赖于 LLMs 已经“会说机器人语言” 这一事实。它们可以生成代码、规划序列和解析指令。它们所缺乏的是感官和身体。
对于一个典型的人形机器人,他们使用 10-15 个不同的 LLMs 同时工作,这些 LLMs 靠近传感器,并将传感器数据转换为字幕。
简而言之:LLMs 就像盲人的大脑。 它们可以想象、推理和规划,但它们不能看或移动。机器人技术提供了眼睛、耳朵和四肢。自然语言成为桥梁,只需一个段落提示,就能将感知转化为行动。
以下是 OM1 的整合方式:

来源:OM1 文档
机器人首先感知世界。摄像头、麦克风、GPS、激光雷达、电池电量,所有你所期望的原始输入流。
然后 OM1 做了一些巧妙的事情。它没有直接将这些输入推送到代码中,而是通过字幕模型运行它们。
视觉变成了一句清晰的句子:“你看到一个男人微笑着指向一把椅子。” 音频变成了另一句:“你刚才听到:腾(你),跑到椅子那里。”
这些句子流入一个名为自然语言数据总线的共享通道。它就像机器人的 Slack。每个传感器都用简单的英语发布其更新。然后一个融合器读取整个流并将其压缩成一个单一的段落。一个情境快照。类似于:
“左侧3.2米:一个微笑着的人指着一把椅子。你听到:腾,跑到椅子那里。电池电量73%。”
这段话成为机器人的现实。它的上下文块。
现在开始推理。上下文进入一个**LLM 皮层**,每个 LLM 都扮演着特定的角色:
-
一个**快速行动 LLM**,用于瞬间反应(令牌响应时间约 300 毫秒)。
-
一个核心认知 LLM,用于更深层次的推理和多步骤规划(响应时间约 2 秒)。
-
一个教练/导师 LLM,每 30 秒评估一次行为,提供反馈和纠正。
这模仿了人类的思维:反射、认知、反思。重要的是,这些 LLMs 并非随意行事。它们的护栏,例如 “永不闯红灯”或“不得进入禁区”,直接取自以太坊上不可更改的智能合约。任何人都可以查看机器人运行的规则。
计划确定后,OM1 会将其转化为行动。通过硬件抽象层 ,高级意图会转换为低级电机指令,该层将决策映射到机器人拥有的任何电机、扬声器或执行器。“拿起红苹果” 变成了一组精确的伺服运动。
然后机器人执行。它移动、说话、做手势,完成整个循环。
感知→描述→融合→推理→行动。重复。每秒数十次。
OM1 的出色之处在于整个流程都通过自然语言运行。机器的思维是可读的。你可以阅读它们。你可以审计它们。更重要的是,其他机器也可以。它是一种用于物理智能的共享语言层。

来源:OM1 文档
为什么是自然语言?
这听起来有悖常理。
如果你窥探机器人的大脑,你会期望找到数学:向量、张量、传感器流。而不是英文段落。
但 Jan Liphardt 和 OpenMind 团队得出了不同的结论。在他们 2024 年的论文《 一段话就够了 》中,他们认为你不需要庞大的端到端模型将像素直接映射到动作。当机器人共享段落时,丰富的行为就开始出现。
一些结构良好的句子可以将机器所知道的一切,例如它看到什么、听到什么以及计划做什么,压缩成一种清晰易读且便于携带的形式。
这种设计选择带来了三大超能力:
-
可观察性: 由于推理以通俗易懂的英语表达,人类可以字面意义上阅读机器人的“思维过程”。调试变得像阅读一份记录一样简单。
-
模块化: 任何 LLM 都可以随意替换。OM1 将它们视为通用接口背后的推理引擎,因此系统会随着模型生态系统的发展而演进。
-
护栏: 像 “没有信号灯绝不横穿马路” 这样的规则可以用自然语言编写,并不可更改地存储在以太坊上。任何人都可以检查这些规则。你不需要信任机器人,你可以验证它运行的规则。
但真正的突破在于机器人如何利用语言相互学习 。
一个机器人的情境感知(“ 你看到前方红灯;在路边停车 ”)可以作为一段话传递给另一个机器人,从而即时传输上下文和学习内容,无需重新训练。
这就像机器人在课堂上窃窃私语。一个机器人弄懂了什么,把它写下来,然后整个群体突然变得更聪明了。我真希望我以前上学时的学习小组也能这样……
权衡之下是效率。语言比机器原生协议慢,但其优点是透明性、可移植性和集体学习。自然语言不仅成为人类与机器人交流的通用语言,也成为机器人相互学习的通用语言。
统一层
OM1 正在为机器人领域带来“安卓时刻”。
在安卓出现之前,每家手机制造商都开发自己的软件堆栈。应用程序支离破碎,兼容性是一场噩梦。安卓抽象化了硬件差异,为开发者提供了一个统一的平台,并释放了一个生态系统。突然之间,任何人都可以一次编写,随处部署。硬件制造商不再编写操作系统,而是专注于设计。
结果不言自明。安卓现在为全球智能手机操作系统市场约 73.9% 的份额提供支持, 拥有约 36 亿活跃设备 。它支持的应用程序经济每年价值已超过 2500 亿美元,预计到 2030 年将突破 6000 亿美元。这就是当你统一认知层并为开发者打开闸门时所发生的一切。
目前,机器人技术仍停留在安卓系统出现之前的阶段。
每个机器人供应商都构建自己的技术栈。开发者为每个平台重新实现自主功能。机器人操作系统市场仍然很小: 到 2025 年约为 6.7 亿美元 , 尽管机器人集成市场已经超过 740 亿美元 。这是一个充满强大硬件的领域,但所有硬件都各自为政。
OM1 改变了这种模式。
一个操作系统。适用于任何机器人。它抽象化了硬件细节,为感知、推理和行动提供了共享接口。你无需为“人形机器人”或“四足机器人”开发。你只需为 OM1 开发,机器会自行学习如何操作。
#2 — FABRIC:机器的神经系统
要解决信任问题 , 需要的不仅仅是认知。你需要一个协调层。
这正是 FABRIC 所提供的:一个去中心化网络,为机器人提供可验证的身份、可编程的规则、安全的通信和原生的结算通道。 它是让机器人成为现实世界中智能、可靠参与者的粘合剂。
当然,大多数机器对机器的通信都发生在链下。区块链不适用于低延迟或大容量数据,如视频或传感器流。FABRIC 将它们用于重要的部分:身份、治理、权限和支付。
身份与章程
每台运行 FABRIC 的机器人都会获得一个加密 ID,该 ID 锚定到 ERC-7777 风格的身份代币。这意味着当两台机器相遇时,例如一架送货无人机和一辆货车,它们可以相互认证: 你是谁,你现在在哪里?
但更强大的想法是宪法 :即存储在链上的可审计规则集。就像 Jan 的机器狗每天早上从以太坊获取行为护栏一样,FABRIC 允许任何利益相关者检查: 这台机器实际运行的是什么指令?
这与谷歌的 Gemini Robotics 在模型层面植入阿西莫夫式规则,或 Anthropic 所称的“宪法式人工智能”精神相似。OpenMind 采取了一条更透明的路径。规则写在以太坊合约中。
沟通与知识共享
一旦两个机器人知道自己是谁,它们就需要一种交流方式。
FABRIC 按需建立加密的对等隧道,就像机器之间的一次性 VPN。送货无人机可以向人行道机器人传递危险警告。仓库漫游车可以与来访的四足机器人共享楼层地图。但这并非开放访问。
每次交换都受权限合同的约束:谁被允许发送什么、发送多长时间以及在什么条件下发送。一个机器人可能共享电池状态但不共享位置。医院助理可能会发送跌倒警报而不泄露患者身份。这种在不泄露信息的情况下共享的平衡,是您在保持安全和知识产权完整的同时扩展协作的方式。
任务协调与市场
FABRIC 还计划成为一个机器人劳务市场。 可以发布任务(“检查货架 X”、“送货到门 Y”),附近的机器人进行投标或接受;协议随后分配并验证工作。完成证明会自动触发付款。
如果公司 A 的人形机器人雇佣了公司 B 的无人机,FABRIC 会记录任务、验证完成情况并转移稳定币,所有这些都无需人工文书工作。责任和保险甚至可以通过智能合约强制执行。
全球知识网络
如果我把视野放得足够远,我可以想象 FABRIC 成为一个全球技能库。
在首尔,一个仿人机器人学会了高效叠毛巾。这项技能被打包、签名并上传。全球任何兼容的机器人都可以下载、调整并执行。贡献者会获得署名和奖励。每次部署都会让网络变得更智能。
这就像具身人工智能的应用商店,只不过你下载的不是《愤怒的小鸟》,而是叉车操作或护理协议。
人类层
FABRIC 不仅仅连接机器。它将人类带入循环。
该网络围绕四个角色构建:
-
机器人所有者注册机器、建立声誉并从部署中获利。
-
终端用户请求送货、检查或清洁等服务。
-
远程操作员在自主系统失效时介入,引导机器人处理边缘情况,并赚取稳定币费用。
-
验证者/基础设施提供商验证身份、位置和任务,确保系统安全。
OpenMind 推出了一款应用程序,将这些角色联系起来。它看起来像早期的 Uber:用户可以请求服务、注册机器或作为远程操作员加入。在推出的前两周,超过 50 万人加入了等候名单。

应用程序是界面。FABRIC 是底层基础设施,它使每次交互都可验证、可审计和可扩展。
我获得了该应用的访问权限,以了解它的实际体验。它仍处于早期阶段,但你可以从中一窥 FABRIC 将如何把人类纳入其运作机制。
目前,你主要可以在应用上做两件事:
-
地图定位: 带着应用四处走动,扫描周围环境,你实际上是在为机器人创建空间数据集。这是一种巧妙的众包方式,可以为机器人最终依赖的地图和边缘案例提供数据。是的,你在此过程中还能赚取积分。这是个不错的锻炼借口。

在 OpenMind 应用上映射位置
-
机器人视频评估: 可以把它想象成给抖音视频打分,但你不是在看舞蹈,而是在看四足机器人上下楼梯,或者人形机器人尝试完成任务。目前,这就像点赞或点踩一样简单,但这些反馈会重新输入到训练循环中,帮助机器人更接近理想性能。

机器人评估视频,在应用程序上有一个简单的反馈循环
今天,它只是简单的行走和滑动,但它也是一个更大事物的支架。随着机器人车队的推出,远程操作员也将加入其中,引导真实机器人处理边缘情况并赚取稳定币。
目前,这款应用感觉就像一款休闲手机游戏(它让我想起了《宝可梦 Go》,但没有可爱的生物)。绘制你的社区地图,评价一些机器人视频,赚取积分。但更宏大的愿景是清晰的,那就是引导机器经济的信任和数据层。
机器经济中的一天
在评估初创公司时,我喜欢做的一件事是深入了解创始人对未来的愿景。如果产品成功,世界会是什么样子?以下是我对 OpenMind 世界中一天的想象:

一个建筑工地,上午时分。
-
一架巡检无人机率先起飞。它扫描脚手架,将原始视频输入到 OM1。系统为画面添加了字幕:
“三楼横梁发现松动接头。”
FABRIC 记录警报,用无人机的加密 ID 签名,并广播一个可验证的任务。
-
一只四足机器人接收到警报。OM1 规划了一条通往目标的路线。在移动之前,机器人查询 FABRIC 以检查无人机的凭据。身份有效。任务确认。
-
四足机器人爬上楼梯并开始传输视频。一位坐在另一个城市的远程操作员通过 OpenMind 应用程序介入。他们引导机器人的摄像头,从更近的角度观察损坏情况,然后退出。在他们关闭标签之前,他们的报酬以稳定币的形式到账。
-
一个人形助手带着工具出现。它与 FABRIC 同步,验证四足机器人的位置,并解析现场工头的命令:
“拧紧接头并重新检查稳定性。”
-
仿人机器人执行维修。OM1 跟踪扭矩读数,借助四足机器人的传感器确认修复,并记录工作。FABRIC 将数据(例如,传感器日志、带时间戳的录像、任务接收确认)打包成加密记录。
-
付款即时到账。建筑钱包将稳定币流式传输给:
-
无人机所有者,用于检测
-
四足机器人所有者,用于检查
-
人形机器人的所有者负责执行
-
远程操作员提供远程协助
-
没有发票。这就是简所设想的机器经济。机器人进行本地推理,进行全球协调,并实时交易。人类在需要时介入。其余的都在自动化轨道上运行。

需求从何而来
好吧……但机器人都在哪儿呢,你可能会问?
根据我的经验,拥有聪明创始人的初创公司往往能正确预见未来,但时机却不对。过早和过晚一样致命。
乍一看,OpenMind 似乎属于“为时过早”的阵营。FABRIC 是为数百万机器人在公共空间互动的世界而设计的。那个世界显然还没有到来。大多数人甚至从未见过机器人。大多数人行道仍然没有机器人。
在 《机器经济理论》 中,我们的内部模型预测,到 2030 年,全球人形机器人的数量可能达到 82 万台。先行者的成功将引发汽车、物流和电子制造领域的“快速追随者”公司浪潮,它们将启动自己的试点项目,以避免在竞争中落后。

不过,那至少还需要 5 到 6 年的时间。OpenMind 认为这股浪潮会比预期来得更快,并正在为迎接海啸的到来做好准备。更重要的是, 早期需求信号已经显现。
开发者和研究人员
-
开发者是第一批被吸引的用户。许多人已经开始使用 OM1,因为它解决了他们最大的难题:碎片化。他们无需为每种机器人学习新的 SDK,而是可以构建可在不同硬件上运行的便携式“技能”。
-
在 SFHacks 上,一个由初次开发者组成的团队将一台 TurtleBot4 变成了一个名为 Remi 的看护机器人,帮助阿尔茨海默症患者回忆亲人和记忆。借助 OM1 模块化运行时的强大功能,他们从零机器人经验到制作出工作原型只用了不到 48 小时。
大学与实验室
-
OpenMind 已与 RoboStore 合作,将 OM1 捆绑到数千套大学机器人套件中。学生们不再局限于各自独立的研究环境,而是拥有了一个通用的操作系统。
-
像斯坦福、牛津和首尔机器人实验室这样的机构已经在课程和研究中使用 OM1。它为学生提供了一种构建具身智能的通用语言,并培养了一批直接在平台上接受培训的开发人员。
原始设备制造商和硬件合作伙伴
-
OpenMind 还与 宇树科技(Unitree) 和 深蓝科技(Deep Robotics) 等机器人制造商合作,将软件植入他们的硬件中。 对于原始设备制造商来说,其价值显而易见:让 OpenMind 处理“大脑”,他们则专注于制造更好的“身体”。连接到 OM1 的机器人越多,该网络对每个人就越有用。
-
这建立了一个模型,硬件公司可以接入一个不断增长的网络效应,而不是重复劳动。
一台运行 OM1 的宇树人形机器人最近敲响了纳斯达克开市钟 ,标志着 KraneShares 全球人形机器人 ETF 的推出。这是一个具有象征意义的时刻,表明机器人技术正迈入文化和金融主流。
(加油,小伙子)

在对 FABRIC 的需求方面, 超过 18 万人类和数千台机器人已加入 OpenMind 身份网络。该应用程序正缓慢地让人们加入,作为人类与网络交互的前门:机器人所有者注册机器,远程操作员提供指导和反馈,最终用户请求服务。
这是一个强烈的早期信号,即使其中一些兴趣是投机性的。未来的代币或空投可能推动了这些数字。但即使只有 10% 是认真的,那也有 5 万用户准备好进入一个全新的机器经济。
关键在于,OM1 正在从需要更智能、更统一的机器人大脑的开发者、企业和原始设备制造商那里产生需求。你也可以看到一个飞轮的雏形:认知和协调从两方面拉动需求。
从协议到商业
如今,人们非常关注创收型企业。在加密货币领域,焦点现在集中在像 Hyperliquid 和 Ethena 这样具有明显吸引力和快速现金流的协议上。
OpenMind 目前尚未盈利。与大多数开源项目一样,其策略清晰:先争取用户,后考虑盈利。
回到与安卓的类比,这是一个我们以前见过的策略。
2005 年,当谷歌收购 Android 初创公司时,人们并没有意识到他们正在打造消费科技领域最成功的开源平台。其战略并非销售软件,而是成为基础设施 ,悄然嵌入每一部非苹果手机。
他们免费提供,允许原始设备制造商(OEM)定制外观和体验。他们没有妥协的是核心:访问谷歌服务,并最终是搜索。每一部 Android 手机都成为了谷歌帝国的分发节点。
很多人都忘记了这一点:Android 并非通过 Android 盈利。 谷歌没有收取许可费。相反,他们锁定了搜索、地图、Gmail 和 Play 商店的默认位置。这些渠道为他们的摇钱树提供了源源不断的资金。
这种默认地位仍然具有极强的粘性。据报道,谷歌每年向苹果支付 200 亿美元 ,仅仅是为了在 iOS 上保持默认搜索引擎的地位。Android 式的地位就是如此宝贵:强大到谷歌甚至向其主要竞争对手支付费用,以避免失去它。
OpenMind 正在上演同样的戏码。 免费提供操作系统。成为认知和协调的默认层。将触角伸向那些你认为将在即将到来的机器人热潮中扮演关键角色的公司和生态系统,并让自己成为其中的默认组成部分。然后……顺势而为。
一旦转换成本很高,并且流量正在通过您的轨道流动,就开始通过以下方面实现边缘货币化:身份、技能、支持、合规性和支付。
当然,这个愿景取决于规模。机器人所有者注册机器、企业插入车队、远程操作员介入以及验证者验证任务。这意味着一个不是拥有数百个机器人,而是拥有数百万个机器人的世界。
而机器人终将实现这一目标。认为不会是愚蠢的。唯一悬而未决的问题是时机。这是一个 2-3 年的故事,还是一个长达十年的艰苦过程?这种不确定性对投资者和 OpenMind 的烧钱速度很重要,但对这一趋势的必然性影响较小。
与此同时,OpenMind 的风险投资为其赢得了时间,以便在洪流到来之前构建好基础设施。将 FABRIC 视为一条在交通出现前几年就铺设好的收费公路:它现在可能看起来空空荡荡,但一旦机器人普及,每一个协调需求和交易都可能通过它进行。
挑战在于活得足够久,才能收取这些“过路费”。
1. 企业支持与服务
标准的开源商业模式包括在基础设施之上销售托管服务。
运营大量机器人的大型组织将需要帮助。医院将需要合规和安全模块。物流公司将需要定制集成。政府可能会要求审计或可验证的政策执行。
如果 OM1 成为标准运行时,OpenMind 可以收取支持、认证和定制费用。它就是机器人领域的红帽。
2. 协议级经济学 (FABRIC)
这是更令人兴奋(也更具加密原生性)的层。如果 FABRIC 成为机器人到机器人以及机器人到人类任务的协调层,OpenMind 可能会获得:
-
结算费用: 机器交易时收取少量佣金。
-
技能市场佣金: 开发者发布机器人“技能”或行为;当这些技能被授权或下载时,OpenMind 会从中抽取一部分收入。
-
身份与合规服务: 为可验证的机器人身份颁发、运行审计追踪或在受监管行业提供证明而收取的费用。
3. 两者之间的飞轮
OM1 引入企业。FABRIC 引入开发者和运营商。两者相互成就,价值倍增。
当企业采用 OM1 时,会产生对技能和协调的需求。这些活动通过 FABRIC 流动。随着 FABRIC 处理的交易增多,它对开发者、原始设备制造商和电信运营商的吸引力也随之增加。更多的采用会带来更多的使用。更多的使用会推动更多的采用。
这就是 OpenMind 试图锁定的循环。
他们今天不需要盈利。当机器普及后,其优势将显而易见。但风险也很明确:如果普及停滞,整个模式也会随之冻结。
Jan 的旅程:从教授到协议构建者
每个协议都始于一个奇特的想法。通常,是一个对此念念不忘的人。
对于 OpenMind 来说,那个人就是 Jan Liphardt。
Jan 没有走寻常的创业之路。他在密歇根州和纽约州之间长大,在里德学院学习物理,然后跨越大西洋在剑桥大学攻读博士学位。
当大多数人专注于优化问题或机器视觉时,扬正埋头于酵母基因组中,寻找回文序列。
不是文学意义上的那种。而是调控意义上的。DNA 中密集的模式,在长段遗传密码中传递指令。他使用随机上下文无关文法来检测大多数机器学习模型遗漏的结构。这并不光鲜,但教会了他如何在混沌系统中发现秩序。

在加州大学伯克利分校完成博士后研究后,他加入了物理系,随后转到斯坦福大学担任生物工程学教授。在此期间,他获得了多项奖学金和荣誉。然而,改变的并非他的头衔,而是他的研究重心。
扬开始着迷于复杂系统如何自我组织。在生物学中。在计算机中。在人类网络中。这种好奇心促使他教授斯坦福大学最独特的课程之一:BioE60:超越比特币 。这是一门关于分布式信任的课程。不仅讲解区块链如何运作,还讲解它们如何用于大规模协调机器、身份和决策。
然后 ChatGPT 出现了。LLMs 开始生成可以控制电机、规划任务和实时推理的代码。扬看到了这座桥梁。他开始在现实世界中测试机器人。他家里摆满了机器狗和一个类人机器人,不是在实验室里,而是在湾区的街道上和他的孩子们一起对它们进行压力测试。
他突然意识到:我们为协调数十亿台计算机而构建的工具,可能正是协调数百万台机器人所需的。这个想法催生了 OpenMind。扬的背景使他非常适合在人工智能、机器人技术、密码学和生物学的交叉领域进行构建。
团队和融资
在他身边,Jan 组建了一支团队,成员包括机器人工程师、分布式系统黑客,以及来自 Databricks、Palantir、McKinsey 和 Perplexity 的资深人士。这是一个融合了深度技术和务实执行的团队,如果你要将全球机器人连接成一个单一网络,这正是你所需要的团队。
正是这种组合说服了 Pantera Capital 领投 2000 万美元的 A 轮融资 ,Coinbase Ventures、DCG、Ribbit Capital、Anagram、Faction、Blackdragon 等公司也参与了投资。种子轮投资者包括 Topology、Primitive、Pebblebed 和 Amber,以及一系列知名天使投资人。

全文披露:我是 OpenMind 天使轮的投资者。我的论点很简单:人工智能赋予机器大脑,机器人技术赋予它们身体,而协调则赋予它们真正的能动性。扬正在构建我想要生活的未来。
我的想法
机器人必须在现实世界中学习
通往通用机器人的道路并非通过实验室学习。它们通过在日常生活中不可预测的环境中生活而进步:湿滑的地板、凌乱的厨房、不可预测的人类。大多数进步都是这样发生的:试错。
问题是,大多数机器人仍然在孤立地学习。每台机器都在自己的沙盒中运行,重复着其他机器已经解决的错误。这种破碎的反馈循环是机器人技术进展相对缓慢的一个关键原因。
自动驾驶汽车暗示了另一种可能性。Waymo 和特斯拉的进步并非因为某辆车能完美驾驶,而是因为整个车队累计行驶了数百万英里。在凤凰城每一次错误的左转,都让旧金山的汽车变得更智能一点。
研究表明,同样的动态也适用于机器人。在像 FLEET-MERGE(ICLR 2024)这样的研究中,当多个机器人将其学习成果贡献给一个共享策略时,任务成功率上升,错误率下降。换句话说, 每增加一个机器人,整个车队都会变得更好。

话虽如此,现实世界的部署是混乱的。大多数机器人没有相同的架构。它们有不同的机体、传感器和控制系统。在模拟中有效的方法,例如在相同的智能体之间合并策略梯度,并不能直接应用于设计迥异的物理机器。在如此多样化的环境中共享经验是困难的。基础设施必须承担基本上是异构性成本。
OpenMind 的论点是 OM1 和 FABRIC 可以承担这一成本。OM1 将原始感知和推理转化为自然语言,创建任何机器人都可以使用的共享格式。FABRIC 处理身份、协调和数据交换。如果系统成立,每个新机器人都会改进其他机器人,将物理试错转化为网络效应。
地缘政治:机器人冷战将至?
最近的宇树 G1 事件,即一台人形机器人被发现秘密地将传感器数据传输回中国的服务器,预示着机器人领域正在形成的地缘政治断层线。
随着机器变得移动化、网络化和日益自主化,它们不再是中立的硬件,而是主权数据设备。 在一个由中美科技竞争定义的世界里,这一点至关重要。
正如华为被西方电信网络拒之门外一样,我预见到未来中国制造的机器人也将被限制进入医院、仓库和学校。一个带有摄像头和麦克风的机器人是一个带腿的移动传感器。一旦大规模部署,国家安全风险显而易见。
矛盾之处在于: 中国目前在机器人领域的创新速度几乎超过了其他任何地方。 他们以比大多数西方公司更低的成本和更快的速度交付人形机器人和四足机器人。美国和欧洲的许多公司都希望利用这一点,但地缘政治摩擦使它们变得“有毒”。西方公司想要硬件,但无法信任软件。
这造成了创新与信任之间的鸿沟。
OpenMind 的架构提供了一座潜在的桥梁。通过设计,OM1 + FABRIC 用可审计和可验证的软件取代了黑盒固件和不透明的数据管道。每一个行为都可以被检查、哈希和公开验证,这是一种具身 AI 的“数字日内瓦公约”。任何人都可以检查机器人正在运行什么规则以及它的数据流向何处 ,而不是听信制造商的一面之词。
这使得 OpenMind 的方法可能成为监管的黄金标准。政府不必禁止外国机器人,而是可以要求任何在公共环境中运行的机器人运行经过认证的开放控制层。或者至少使用源自 FABRIC 的标准来公开行为和数据策略。
如果机器人技术成为下一个全球基础设施层,类似于电信和半导体,那么中立性和开放性将与性能同等重要。从这个意义上说,OpenMind 正在为多极机器经济构建信任结构。
结论
很快,机器人将走出实验室,走进我们的家园。问题不在于它们是否会无处不在,而在于它们一旦到达那里,将如何协同工作。
OpenMind 押注于两个层面:认知和协调。
-
OM1 为机器提供了一个共享大脑。
-
FABRIC 为它们提供了一个共享协议,用于信任、身份和支付。
封闭的参与者可能会在早期取得领先。特斯拉。Figure。苹果式的完全控制的堆栈。但从长远来看,我们知道开放系统往往会获胜。TCP/IP 比私有网络更持久。安卓系统埋葬了当时的手机操作系统。
OpenMind 正在为具身 AI 构建开放层。如果成功,这不仅仅是一个机器人故事,它将是机器经济的开端。数百万个自主代理在本地推理、全球协调并原生交易。
第一批机器人已经问世。接下来是网络。
感谢阅读,
0xAce 和 Teng Yan