超越语言:为何具身智能是下一个前沿领域
本文信息来源:obvious
正如 LLMs 能够预测下一个单词,机器人模型正在学习预测下一个物理动作。

过去几年,科技领域的重大突破重塑了数字世界。ChatGPT 目前月活跃用户已突破 50 亿,95%的美国企业表示正在使用生成式 AI 提升业务功能。
尽管这些数字突破带来了变革性影响,但更宏大的变革正在酝酿。我们正开启从数字世界向物理世界的创新转型。
种种迹象表明,我们正在进入物理智能体时代。它们不再是过去简单的机器人系统,如自动吸尘器和工业机械臂,而是能真正思考、实时适应并做出决策的通用系统。我们谈论的是各种形态的机器人——从汽车、送货无人机到人形机器人——它们都具备判断力并能从经验中学习。
当前机器人技术的突破与语言模型的核心技术同源。但 LLMs 通过海量文本数据训练来预测下一个单词,而机器人基础模型则通过视频、模拟和人类示范学习预测下一个物理动作。
前景同样令人期待。正如 LLM 能够在零样本或少样本情况下预测下一个单词或句子,即几乎不需要示例,机器人基础模型也开始展现出类似的适应性,能够预测下一个物理动作。它们让机器人学习通用技能,并将其应用于新任务,只需有限甚至在某些情况下无需大量训练。我们已经看到了惊人的进展,从训练四足机器人完成跑酷课程 ,到人形系统能够装载洗碗机和准备食物 。
尽管技术不断进步,机器人技术仍面临诸多挑战,使其远比语言模型更为复杂。首先,虽然 LLMs 可以通过互联网规模的文本进行训练,但物理工作领域却缺乏现成的等效数据资源。每台机器人都必须通过模拟、示范和现实世界中的反复试错来学习,这使得进展更为缓慢且成本高昂。其次,物理人工智能与硬件密不可分。在语言领域,文本可以作为硬件无关模型的标准化输入输出;而在机器人领域,输入输出完全依赖于硬件设备。机器人可能通过多种传感器感知世界,并向各类电机和执行器输出控制指令,这种多样性使得标准化输入输出表示难以定义。第三,机器人运行在一个充满不确定性的世界中。无论是穿越杂乱的建筑工地,还是在仓库中小心处理易碎物品,物理环境都充满不可预测性和严苛性。
在 Obvious,我们看到应对这些挑战蕴含着巨大机遇,因为率先行动的企业将引领触及各行各业的变革性突破。试想完全由机器人组成的太阳能施工队以前所未有的规模建造清洁能源基础设施。在医院里,机器人可以协助补充物资,甚至参与外科手术。最适合自动化的工作往往具有危险性、难以填补或人们根本不愿从事的特点。Obvious 投资组合企业 Dexterity 和 Pyka 已开始运用机器人系统执行高危任务,例如仓库货车装卸和空中作物喷洒——这两类工作历来具有高伤亡率的特点。
我们对与这些系统共同构建的未来充满信心——它们不仅能催生新企业和新产品,更能打造一种新型基础设施,彻底改造每个行业并开启全新领域。我们专注于为未来的变革者打造"神经系统",与创业者和创新者携手构建那些能与人类协同工作、助力可持续增长、并承担曾经自动化无法触及任务的智能系统。
本周在旧金山 TEDAI 大会上,我将在 Obvious 主办的"AI 下一前沿 "专题讨论中深入探讨这波机器人 AI 浪潮。这场变革的规模与速度将远超多数人预期。我们还将探讨如何以远见和道德责任来驾驭这场转型的关键路径。
若想深入了解我们对机器人 AI 及其他世界向善技术的展望,可关注今秋即将发布的 Obvious《2026 世界向好报告》 中我的专题文章。