Generalist AI 完成4亿美元融资：当具身智能进入工业场景，这家公司用通用基础模型重新定义机器人的”手感”

项目速览

项目名称 Generalist AI

融资轮次融资

融资金额 4亿美元

投资方 8VC

工业机器人已经在流水线上工作了半个世纪，然而直到今天，它们依然无法独立处理一个皱巴巴的塑料袋，这个连三岁孩子都能轻松完成的任务，对传统机器人来说却是一道几乎不可逾越的鸿沟。问题的核心不在于机械臂的力道，而在于”感知-决策-执行”这一闭环的智能化程度：当外部世界充满不确定性时，机器人缺乏真正意义上的”手感”。

这正是Generalist AI试图解决的问题。2026年6月，这家总部位于旧金山的具身智能公司完成了4亿美元的新一轮融资，投后估值达到20亿美元。本轮融资由8VC领投，Bezos Expeditions（贝索斯家族投资机构）、NVentures（英伟达旗下风险投资部门）、Radical Ventures、Union Square Ventures 和 Hanabi Capital 联合参与。

具身智能的”最后一公里”：为何抓取柔性物体如此困难

在工业自动化领域，有一个被反复提及但鲜少被解决的难题：柔性物体操控（Deformable Object Manipulation）。传统机器人依赖预设程序和刚性的动作规划，当遇到形状不固定、材质可变的对象，无论是食品包装、布料、电子零件还是工业软管，它们往往束手无策。

这一局限催生了一个庞大的市场空白。全球工厂中，有超过40%的人工操作步骤涉及柔性材料或非结构化物体的抓取与分拣，这些任务至今仍严重依赖人力。与此同时，随着全球制造业劳动力成本持续攀升，以及新冠疫情后”制造回流”浪潮的推进，企业对自动化解决方案的迫切需求前所未有。

然而，解决这一问题的路径并非更换更好的机械臂或更精密的传感器，而是从根本上改变机器人的”决策方式”。这意味着机器人需要像人类一样，在抓取的瞬间持续感知、推断物体的物理属性，并实时调整策略，这正是人工智能基础模型（Foundation Model）的用武之地。

GEN-1：将视觉-语言-动作融为一体的”行动大脑”

Generalist AI 的核心产品是 GEN-1，一个视觉-语言-动作（Vision-Language-Action，VLA）基础模型。与传统机器人控制软件不同，GEN-1 采用端到端的神经网络架构，将摄像头的视觉输入、自然语言指令和机械臂的动作控制统一在同一个模型框架中。

关键技术特点：GEN-1 能够让机器人硬件在面对可变形物体或环境条件发生变化时，自主地适应、抓握并重新校准，无需为每个新任务重新编程。

公司创始人 Pete Florence 担任 CEO，前谷歌 DeepMind 研究员 Andy Zeng 担任首席科学家（Chief Scientist），Andrew Barry 担任首席技术官（CTO）。这一团队组合颇具深意：Florence 和 Zeng 均曾在谷歌机器人研究部门主导过大型操控模型的开发，是少数真正将学术成果落地为工业级产品的研究者。

GEN-1 的技术路线与 OpenAI、DeepMind 的机器人研究方向高度一致，但专注于更垂直的工业操控场景。通过大规模的机器人操控数据训练，GEN-1 可以让不同品牌、不同形态的机械臂获得”迁移学习”能力，同一个模型，适配多种硬件，处理多种任务。

关键数据：据公司描述，GEN-1 能够在处理形变物体时，实时完成”感知-判断-动作校准”的完整闭环，无需针对特定物体类型进行专项训练。

商业化路径：从通用模型到行业落地

与许多具身智能创业公司不同，Generalist AI 并不追求自建机器人硬件，而是走”软件+模型即服务”的平台化路线。这一策略降低了资产重度，同时大幅扩大了潜在合作伙伴的范围。

主要商业化方向包括：

1. 制造业集成：与工业机器人制造商（如 ABB、FANUC、优必选等）合作，将 GEN-1 作为智能控制层嵌入现有机械臂系统； 2. 物流与仓储：针对快递分拣、仓库拣货等高度依赖人工的场景，提供即插即用的柔性操控解决方案； 3. 食品与消费品加工：在食品饮料、日化等行业，大量非结构化包装处理任务亟需自动化； 4. 半导体与精密制造：高端制造场景对操控精度要求极高，GEN-1 的实时校准能力具备独特优势。

4亿美元的融资规模，为 Generalist AI 提供了充足的弹药用于扩大规模部署，同时也支撑其持续迭代模型，具身智能领域的竞争，本质上是数据飞轮的竞争：越多机器人在真实环境中运行，积累的操控数据越丰富，模型越强，吸引越多合作伙伴，形成正向循环。

资金与技术的双重赛跑

具身智能赛道在过去两年吸引了大量顶级机构的押注，竞争格局已初步成型。

竞争对手	核心定位	对 Generalist AI 的威胁
Figure AI	通用人形机器人，主打工厂场景	垂直整合能力更强，但硬件成本高、扩展慢
Physical Intelligence (π)	通用机器人策略基础模型	技术路线相似，已获超5亿美元融资
1X Technologies	人形机器人，软件+硬件一体化	硬件先行，软件生态尚未形成规模
Apptronik	人形机器人，主打制造与物流	有 NASA 背景，但商业化进展较慢
谷歌 DeepMind	RT-2 等多模态机器人模型	技术储备深厚，但商业化路径不清晰
官网	https://www.generalist-ai.com

Generalist AI 最直接的竞争对手是 Physical Intelligence（π），两家公司在技术路线上高度相似，都将 VLA 基础模型作为核心，且团队背景存在重叠。差异在于，π 主打开放平台，Generalist AI 更强调工业场景的深度适配和柔性物体操控的垂直优势。

值得注意的是，英伟达旗下 NVentures 参与本轮融资，释放出明确信号：具身智能的计算需求将构成 GPU 算力的新一轮增量，英伟达有战略动机扶持生态中的关键模型层玩家。

投资人逻辑：为何 Bezos 和 NVIDIA 同时下注

本轮融资汇聚了三类逻辑截然不同的投资人，颇值得解读：

8VC（领投方）：科技与生命科学深度交叉领域的专家，对硬科技商业化路径有丰富判断。领投意味着对 Generalist AI 商业模式可行性的高度认可。

Bezos Expeditions：贝索斯家族的直接投资机构，长期关注机器人与自动化。亚马逊庞大的仓储自动化体系是这类投资的战略折射，柔性操控技术一旦成熟，将是亚马逊物流网络的刚性需求。

NVentures（英伟达）：具身智能运行依赖大量边缘推理算力，而英伟达的 Jetson 系列芯片正在成为工业机器人的”大脑”。投资 Generalist AI，是英伟达构建具身智能生态的重要一步。

Radical Ventures：加拿大 AI 领域最重要的风险投资机构之一，专注于深度 AI 基础设施和应用，Geoffrey Hinton 是其顾问。Radical 的加入，代表了全球 AI 学术界对这条技术路线的背书。

这一投资人组合意味着：Generalist AI 被视为不仅仅是一家机器人公司，而是一个具备平台潜力的 AI 基础设施层，就像 OpenAI 之于大语言模型，Generalist AI 或许正在尝试成为具身智能的”基础模型层”。

⚠️ 风险与不确定性

⚠️ 风险一：数据壁垒尚未建立具身智能的核心竞争力在于操控数据的积累量与质量。目前 Generalist AI 仍处于早期部署阶段，若竞争对手（如 Physical Intelligence）率先建立大规模数据飞轮，后发者将面临模型性能的长期劣势。

⚠️ 风险二：硬件兼容性碎片化采用”纯软件”策略意味着 GEN-1 需要适配市场上数十种不同规格的机械臂和传感器方案。硬件接口的碎片化将显著增加集成成本，拖慢商业化节奏。

⚠️ 风险三：工业客户采购周期漫长制造业客户在引入新型自动化系统时，通常需要经历长达12-24个月的评估、试点和正式采购流程。这意味着即便技术成熟，Generalist AI 也将面临漫长的商业化爬坡期，烧钱节奏需要精心管控。

⚠️ 风险四：人形机器人范式的替代威胁以 Figure AI、Tesla Optimus 为代表的通用人形机器人，试图用一套完整的硬件平台取代分散的工业机械臂生态。若人形机器人产品化速度超出预期，Generalist AI 的”模型嵌入现有硬件”模式可能面临釜底抽薪的结构性风险。

结语：基础模型时代，具身智能的”GPT时刻”

过去三年，大语言模型的爆发证明了一件事：当基础模型足够通用、足够强大，垂直应用的创建门槛将以数量级的速度下降。具身智能领域，正在重演同样的剧本，区别在于，这一次需要让模型不仅理解语言和图像，还要真正”理解”物理世界。

Generalist AI 以4亿美元和20亿美元估值站上具身智能赛道的主牌桌。贝索斯、英伟达和顶尖 AI 风投的同时押注，意味着资本已经做出判断：通用操控基础模型，将是下一个十年工业自动化的底层操作系统。

当然，从演示实验室到工厂地板，这段距离从来不像融资公告所暗示的那样近。但如果 GEN-1 真的能让机器人学会”手感”，那才是真正意义上改变制造业格局的历史性时刻。

信息来源

Pulse 2.0 (pulse2.com) / FinSMEs (finsmes.com)

分类与标签

项目	内容
分类	AI / 人工智能
标签	Generalist AI、机器人、AI人工智能
适合读者	关注AI应用、大模型生态和智能体赛道的投资人与创业者