在中国的数据工厂里,工人教人形机器人完成枯燥的任务
本文信息来源:restofworld
随着中国将具身智能提升为国家优先事项,地方政府正在建设培训中心,以应对机器人数据短缺的问题。

- 地方政府已资助设立40个训练中心,以应对机器人研究中的数据短缺问题。
- 在这些设施中,人类训练员通过模仿叠衣服、擦桌子等动作来教导机器人。
- 研究人员仍在争论,大规模数据采集是否是构建完全智能机器人的最有效方式。
在上海一间灯火通明的办公室里,Kim 这一周的任务是假装自己在打开微波炉的门。他戴着虚拟现实头显,手臂上穿着外骨骼,每天重复这个动作数百次,好让身旁的人形机器人学习。其他时候,Kim 会模仿叠衣服,或堆放木块。
20 岁的 Kim 是一名计算机科学专业的学生,在一家领先的机器人初创公司担任训练员。他是中国数百名机器人训练员之一,工作内容是为机器人生成运动数据。政府认为,这些数据对于提升生产力、应对劳动力短缺以及巩固技术优势至关重要。
“我们称自己为‘赛博劳工’,”Kim 在接受 Rest of World 采访时表示。由于未获授权对媒体发声,他使用了化名。“这份工作还不错,就是有点无聊。”
Kim 是中国发展成为机器人强国战略中的关键一环,这被视为中美科技竞赛的下一个前沿。2025 年初,中国政府强调具身智能——即具备物理形态的人工智能——是国家优先发展的方向,由此引发了对机器人(包括人形机器人)研发的投资热潮,这些机器人有望在未来像人类一样思考和行动。
在利用海量数据集训练大型语言模型方面取得的全球性成功,助长了这样一种信念:类似的规模化方法也可以用于机器人。但机器人所需的数据集要复杂得多——包括视觉信息、关节运动、旋转等——这些数据既无法轻易从互联网上抓取,也难以通过合成方式生成。
150目前在中国运营的人形机器人公司的数量。
中国地方政府正通过国家出资的“机器人训练中心”来应对这一数据瓶颈。这些设施通常由地方政府建设,并由机器人公司运营。根据国家媒体的报道 ,它们一般占用数千平方米的办公空间,配备数十台机器人。在其中一些中心,像 Kim 这样的训练员会反复演示日常任务,以生成关键的运动数据。
据情报公司 Interact Analysis 称,截至 12 月,全国已宣布设立 40 多个国有机器人数据采集中心,其中约有二十多个已经投入运营。
其中规模最大的设施之一,是位于北京郊区的一处训练营,由石景山区政府与人形机器人公司 Leju 合作推出。根据政府声明 ,该基地占地面积超过 1 万平方米(约 10.8 万平方英尺),为人形机器人训练提供了 16 种具体场景,包括模拟汽车装配线、智能家居以及养老机构等环境。

“这就像通过大量练习教孩子走路一样,”声明中援引该项目的一位发言人表示。“该训练营旨在解决数据短缺问题。”所产生的标准化、大规模数据可以在整个行业内共享,从而解决企业各自生成的数据质量参差不齐的问题。
在湖北省的另一处政府数据采集中心,近 100 台由人类操控的人形机器人每天反复进行数百次诸如叠衣服、熨烫和擦桌子等动作数百次 。
虽然这些设施可以为负担不起自有训练场地的小型初创公司提供数据,但基础设施建设也存在导致产能过剩的风险。Interact Analysis 的分析师 Marco Wang 在接受 Rest of World 采访时表示:“这里面存在一些潜在的泡沫。”
根据高盛的估计,到 2035 年,人形机器人的全球市场规模可能达到 380 亿美元,最早到 2030 年出货量就可达约 25 万台。中美公司正在引领开发智能机器人的竞赛,这些机器人能够与人类共同生活,并从事体力劳动以及家务工作。
领先的参与者包括美国公司 Figure——最近估值达 390 亿美元——以及 1X 和特斯拉。中国顶级人形机器人制造商,如宇树科技(Unitree Technology)、Galbot 和 AgiBot,估值均已超过 10 亿美元,其中宇树计划于今年上市。美国公司也招募人类为机器人训练生产数据,但规模要小得多。特斯拉有数十名工人通过模拟动作来训练其 Optimus 人形机器人。
在硅谷,风险投资正推动机器人热潮,而中国的产业则在政府支持下被迅速加速。中国经常通过产业政策来扶持战略性产业,但这也曾导致资源浪费、 产能过剩以及价格战。2000 年代,在中央政府指示发展电动汽车产业之后,多个省市竞相推出补贴、税收减免和贷款。政府机构和国有公交公司在电动车尚未达到消费者可接受水平之前,就购买了首批电动车 。
该国如今正寄希望于采取类似的方式来推动其机器人产业的发展。除了数据采集中心外,地方政府还设立了具身智能基金,推出补贴以帮助企业获取算力资源,并在高校开设了具身智能相关课程。

卡内基国际和平基金会的分析师 Pavlo Zvenyhorodskyi 在接受 Rest of World 采访时表示:“中央政府正在向地方政府发出明确信号,期望他们为本地企业提供落地、切实的支持。每个地方政府都在创造性地制定支持措施。”
鉴于商业化应用可能仍遥遥无期,中国人形机器人的一些最大订单来自公共部门,其中包括培训设施。近期,总部位于深圳的优必选科技(UBTech Robotics)向江西、广西和四川三省的三家数据采集中心出售了价值 5.66 亿元人民币(8000 万美元)的人形机器人。
中国移动这家国有电信运营商于 7 月向领先的机器人制造商 Unitree 和 AgiBot 下达了价值 1.24 亿元人民币(1760 万美元)的订单。这些人形机器人将被用于研究、客户服务以及安全巡逻。
对产能过剩的担忧正在加剧。11 月,中国经济规划机构——国家发展和改革委员会——就人形机器人产业出现泡沫风险发出了罕见警告 。该机构发言人李超表示,目前中国有 150 多家人形机器人公司在运营。
数据采集设施的激增之际,机器人研究人员仍在争论,记录人类运动数据——这一过程劳动强度高、耗时漫长——是否是构建完全智能机器人(Build[Programming])的最佳方式。研究人员正在探索替代方法 ,例如使用数字模拟(Simulation[Game]),或从已经投入工作的机器人身上收集数据。
加州大学伯克利分校的机器人研究员 Ken Goldberg 对 Rest of World 表示,中国数据工厂的成本效益目前尚不清楚。
Goldberg 说:“这是一项崇高的努力,目前大家对此能成功抱有很大希望。但进展缓慢。即便有数百人参与,也需要很长时间才能获得足够的数据。