Generalist AI 完成4亿美元融资:当具身智能进入工业场景,这家公司用通用基础模型重新定义机器人的”手感”
工业机器人已经在流水线上工作了半个世纪,然而直到今天,它们依然无法独立处理一个皱巴巴的塑料袋,这个连三岁孩子都能轻松完成的任务,对传统机器人来说却是一道几乎不可逾越的鸿沟。问题的核心不在于机械臂的力道,而在于”感知-决策-执行”这一闭环的智能化程度:当外部世界充满不确定性时,机器人缺乏真正意义上的”手感”。
这正是Generalist AI试图解决的问题。2026年6月,这家总部位于旧金山的具身智能公司完成了4亿美元的新一轮融资,投后估值达到20亿美元。本轮融资由8VC领投,Bezos Expeditions(贝索斯家族投资机构)、NVentures(英伟达旗下风险投资部门)、Radical Ventures、Union Square Ventures 和 Hanabi Capital 联合参与。
具身智能的”最后一公里”:为何抓取柔性物体如此困难
在工业自动化领域,有一个被反复提及但鲜少被解决的难题:柔性物体操控(Deformable Object Manipulation)。传统机器人依赖预设程序和刚性的动作规划,当遇到形状不固定、材质可变的对象,无论是食品包装、布料、电子零件还是工业软管,它们往往束手无策。
这一局限催生了一个庞大的市场空白。全球工厂中,有超过40%的人工操作步骤涉及柔性材料或非结构化物体的抓取与分拣,这些任务至今仍严重依赖人力。与此同时,随着全球制造业劳动力成本持续攀升,以及新冠疫情后”制造回流”浪潮的推进,企业对自动化解决方案的迫切需求前所未有。
然而,解决这一问题的路径并非更换更好的机械臂或更精密的传感器,而是从根本上改变机器人的”决策方式”。这意味着机器人需要像人类一样,在抓取的瞬间持续感知、推断物体的物理属性,并实时调整策略,这正是人工智能基础模型(Foundation Model)的用武之地。
GEN-1:将视觉-语言-动作融为一体的”行动大脑”
Generalist AI 的核心产品是 GEN-1,一个视觉-语言-动作(Vision-Language-Action,VLA)基础模型。与传统机器人控制软件不同,GEN-1 采用端到端的神经网络架构,将摄像头的视觉输入、自然语言指令和机械臂的动作控制统一在同一个模型框架中。
关键技术特点:GEN-1 能够让机器人硬件在面对可变形物体或环境条件发生变化时,自主地适应、抓握并重新校准,无需为每个新任务重新编程。
公司创始人 Pete Florence 担任 CEO,前谷歌 DeepMind 研究员 Andy Zeng 担任首席科学家(Chief Scientist),Andrew Barry 担任首席技术官(CTO)。这一团队组合颇具深意:Florence 和 Zeng 均曾在谷歌机器人研究部门主导过大型操控模型的开发,是少数真正将学术成果落地为工业级产品的研究者。
GEN-1 的技术路线与 OpenAI、DeepMind 的机器人研究方向高度一致,但专注于更垂直的工业操控场景。通过大规模的机器人操控数据训练,GEN-1 可以让不同品牌、不同形态的机械臂获得”迁移学习”能力,同一个模型,适配多种硬件,处理多种任务。
关键数据:据公司描述,GEN-1 能够在处理形变物体时,实时完成”感知-判断-动作校准”的完整闭环,无需针对特定物体类型进行专项训练。
商业化路径:从通用模型到行业落地
与许多具身智能创业公司不同,Generalist AI 并不追求自建机器人硬件,而是走”软件+模型即服务”的平台化路线。这一策略降低了资产重度,同时大幅扩大了潜在合作伙伴的范围。
主要商业化方向包括:
1. 制造业集成:与工业机器人制造商(如 ABB、FANUC、优必选等)合作,将 GEN-1 作为智能控制层嵌入现有机械臂系统;
2. 物流与仓储:针对快递分拣、仓库拣货等高度依赖人工的场景,提供即插即用的柔性操控解决方案;
3. 食品与消费品加工:在食品饮料、日化等行业,大量非结构化包装处理任务亟需自动化;
4. 半导体与精密制造:高端制造场景对操控精度要求极高,GEN-1 的实时校准能力具备独特优势。
4亿美元的融资规模,为 Generalist AI 提供了充足的弹药用于扩大规模部署,同时也支撑其持续迭代模型,具身智能领域的竞争,本质上是数据飞轮的竞争:越多机器人在真实环境中运行,积累的操控数据越丰富,模型越强,吸引越多合作伙伴,形成正向循环。
资金与技术的双重赛跑
具身智能赛道在过去两年吸引了大量顶级机构的押注,竞争格局已初步成型。
Generalist AI 最直接的竞争对手是 Physical Intelligence(π),两家公司在技术路线上高度相似,都将 VLA 基础模型作为核心,且团队背景存在重叠。差异在于,π 主打开放平台,Generalist AI 更强调工业场景的深度适配和柔性物体操控的垂直优势。
值得注意的是,英伟达旗下 NVentures 参与本轮融资,释放出明确信号:具身智能的计算需求将构成 GPU 算力的新一轮增量,英伟达有战略动机扶持生态中的关键模型层玩家。
投资人逻辑:为何 Bezos 和 NVIDIA 同时下注
本轮融资汇聚了三类逻辑截然不同的投资人,颇值得解读:
8VC(领投方):科技与生命科学深度交叉领域的专家,对硬科技商业化路径有丰富判断。领投意味着对 Generalist AI 商业模式可行性的高度认可。
Bezos Expeditions:贝索斯家族的直接投资机构,长期关注机器人与自动化。亚马逊庞大的仓储自动化体系是这类投资的战略折射,柔性操控技术一旦成熟,将是亚马逊物流网络的刚性需求。
NVentures(英伟达):具身智能运行依赖大量边缘推理算力,而英伟达的 Jetson 系列芯片正在成为工业机器人的”大脑”。投资 Generalist AI,是英伟达构建具身智能生态的重要一步。
Radical Ventures:加拿大 AI 领域最重要的风险投资机构之一,专注于深度 AI 基础设施和应用,Geoffrey Hinton 是其顾问。Radical 的加入,代表了全球 AI 学术界对这条技术路线的背书。
这一投资人组合意味着:Generalist AI 被视为不仅仅是一家机器人公司,而是一个具备平台潜力的 AI 基础设施层,就像 OpenAI 之于大语言模型,Generalist AI 或许正在尝试成为具身智能的”基础模型层”。
⚠️ 风险与不确定性
⚠️ 风险一:数据壁垒尚未建立
具身智能的核心竞争力在于操控数据的积累量与质量。目前 Generalist AI 仍处于早期部署阶段,若竞争对手(如 Physical Intelligence)率先建立大规模数据飞轮,后发者将面临模型性能的长期劣势。
⚠️ 风险二:硬件兼容性碎片化
采用”纯软件”策略意味着 GEN-1 需要适配市场上数十种不同规格的机械臂和传感器方案。硬件接口的碎片化将显著增加集成成本,拖慢商业化节奏。
⚠️ 风险三:工业客户采购周期漫长
制造业客户在引入新型自动化系统时,通常需要经历长达12-24个月的评估、试点和正式采购流程。这意味着即便技术成熟,Generalist AI 也将面临漫长的商业化爬坡期,烧钱节奏需要精心管控。
⚠️ 风险四:人形机器人范式的替代威胁
以 Figure AI、Tesla Optimus 为代表的通用人形机器人,试图用一套完整的硬件平台取代分散的工业机械臂生态。若人形机器人产品化速度超出预期,Generalist AI 的”模型嵌入现有硬件”模式可能面临釜底抽薪的结构性风险。
结语:基础模型时代,具身智能的”GPT时刻”
过去三年,大语言模型的爆发证明了一件事:当基础模型足够通用、足够强大,垂直应用的创建门槛将以数量级的速度下降。具身智能领域,正在重演同样的剧本,区别在于,这一次需要让模型不仅理解语言和图像,还要真正”理解”物理世界。
Generalist AI 以4亿美元和20亿美元估值站上具身智能赛道的主牌桌。贝索斯、英伟达和顶尖 AI 风投的同时押注,意味着资本已经做出判断:通用操控基础模型,将是下一个十年工业自动化的底层操作系统。
当然,从演示实验室到工厂地板,这段距离从来不像融资公告所暗示的那样近。但如果 GEN-1 真的能让机器人学会”手感”,那才是真正意义上改变制造业格局的历史性时刻。