面向工业流程的隐藏结构模型
>
2026 年 4 月 14 日
很多工业 AI 都围绕可见任务来构建。系统能否检查零件、分拣物品、移动物体、分类缺陷或完成人类过去手动完成的步骤?
这些是令人兴奋的机会,但它们只是可能性的一小部分。一些最重要的工业问题从外部是看不见的。
过去一周,我与 Gradient Robotics 的创始人之一 Angus Muffatti 探讨了这个想法。表面上,Gradient 看起来是一家焊接机器人公司。但 Angus 对公司的描述不同:”我们正试图构建冶金 AI,而不是焊接 AI。目标是理解材料行为,以便知道焊接过程是否真正有效。”
要理解材料行为,你需要理解材料、热量、几何形状和执行之间的相互作用。这需要学习对过程的隐藏结构进行建模。
二进制 vs. 连续问题
Angus 将此构建为二进制问题和连续问题之间的差异。
某些工业任务的结果是二进制的。你把产品放进盒子里了吗?是或否。成功标准很容易验证。系统要么完成了任务,要么没有完成。
但焊接不是这样。”这是一个连续的问题,从零到一之间,工作做得有多好的范围是无限的,”Angus 说。”焊接表面看起来可以接受,但实际上可能很糟糕。”成功标准埋在材料不同属性之间的相互作用中。
“人类焊工正在推断他们组装的材料内部发生了什么。他们在解释信号并基于他们通常无法直接观察到的事物进行调整,”Angus 告诉我。
换句话说,表面外观是不够的。
这个想法超越了焊接。一个零件可能通过视觉检查但仍在某种应力下失败。抛光过程可能达到目标光洁度,同时过度地使材料变薄。加工过程可能保持吞吐量,同时加速刀具磨损并随时间增加变化。焊接系统可能产生看起来对眼睛可接受的接缝,但削弱疲劳寿命或引入仅在以后才显现的缺陷。在每种情况下,可见输出可能看起来正确,即使底层过程偏离了真正重要的东西。
“工业 AI 中的近期兴奋集中在二进制问题上。但一些更深层次的机会是围绕解决连续问题的,”Angus 相信。这需要学习过程内部发生的事情,足以智能地干预。
为什么焊接是一个有用的测试案例
焊接是一个好镜头,因为它在一个地方集中了工业 AI 的许多核心挑战。它受劳动力限制、技能限制、对质量敏感,并与许多行业的生产结果紧密相关。出错的代价很高。
正如 Angus 告诉我的,”焊接占技术工种的约 2%,但占短缺的约 30%。每年,焊工的缺口约为 80,000 人。流失约占其中一半,需求增加占另一半。”根据美国焊接协会,目前焊工短缺超过 400,000 人(来源)。这使得焊接的自动化与人们有时心中的劳动自动化漫画不同。挑战是面对萎缩的劳动力基础,行业是否以及如何能保持产出。”如果我们的机器人系统只是能跟上这种技术工种的差距,那将勉强足够。”
同时,质量滑动的经济容忍度极低。”如果你 100 个零件的废品率高于 2,你就开始扰乱 ROI 计算。”
而且因为质量数据隐藏在物理材料内部,数据要求看起来与数字 AI 非常不同。”数据要求要难 10 到 100 倍,”Angus 告诉我。在数字系统中,信号通常已经在日志或文本中被捕获。在连续工业系统中,相关信号隐藏在物理过程或物理材料内部。
这改变了”数据收集”的含义。它可能涉及在焊接期间跟踪热量分布的热相机,监测焊池几何形状的机器视觉系统,来自电源的电流和电压追踪,来自过程本身的力、扭矩、振动或声学特征,以及下游检查数据,如 X 射线、超声波、CT 扫描、金相学、拉伸测试、硬度测量或化学和微观结构分析。在某些工作流中,最高价值的信号仅在零件在现场运行后出现。
这使得数据问题变得困难。数据收集较慢,获得真实情况可能需要破坏性测试或长反馈周期。标记也更难,因为”好”通常不是单一的二进制结果。目标本身也可能有争议:你是在优化即时产量、外观质量、结构完整性、吞吐量还是现场寿命表现?
即使是仿真也不像外人假设的那么有用。”仿真保真度还不够好,传统 FEA 方法非常昂贵,运行速度太慢,无法在生产环境中使用。它们还假设理想化的材料,而真实世界要复杂得多,”Angus 告诉我。”然而,这是我们正在积极解决的问题。”
相比之下,某些类别的机器人技术看起来更容易开始。”拾取和放置可能是你可以在一个下午训练出来的东西。”在这里,原型路径较短,进展更容易展示,而连续问题类别中进展往往较慢且更难可视化。
“但一旦你能做到,它就成为一个重要的护城河,”Angus 相信。
这是 AI 中更广泛出现的一种模式。最具防御性的机会通常是学习循环最难构建、真实情况最难提取的机会。
在替换它之前参与判断
这也有助于解释为什么这些环境中的自主性通常必须逐步赢得。
“我们没有在第一天就坐到车里把手从方向盘上拿开,”Angus 说。”同样,我们不会进入并承诺端到端完整过程。”
部分是技术性的。部分是文化性的。在许多制造环境中,焊接等系统与产品质量、客户信任和机构身份紧密相关。”对于很多制造业务,焊接是他们的核心能力或其核心能力的一部分。”
这使得完全抽象在情感上和操作上都很困难。”一家公司进来说,忘了你的核心能力,让我们处理它,会引起过敏反应,”Angus 说。在许多情况下,这种反应是合理的。”他们想控制他们产品的质量输出,因为那是他们的声誉。”
所以更好的模型是分阶段部署。从有用的东西开始。帮助操作员。改善一致性。改善质量。保持人类干预、纠正和塑造过程的能力。”从根本上说,我们的工作只是制造更好的机器。不要消除操作员纠正和编辑事物的能力。这也使系统变得更好,因为你从那些纠正中学习。”随着时间的推移,产品变得更好,信任建立起来——最终,更多的系统可以变得自动化。
AlphaFold 类比
在其他领域有这种转变的先例。在生物学中,最大的飞跃之一发生在系统在推断底层结构方面变得更好时。AlphaFold 从其氨基酸序列预测蛋白质的三维结构,这帮助研究人员推断了一种以前难以且昂贵地通过实验确定的属性。这改变了研究人员甚至可以提出的问题类型,并通过加速新药物和治疗的发现解锁了巨大的下游价值。
工业 AI 可能需要类似的举措。在许多工业过程中,重要变量埋在材料行为、过程动力学、公差和操作员通过经验学会推断的物理交互中。在那些环境中,有一个机会很好地恢复系统的隐藏状态以理解为什么发生结果以及要改变什么。这反过来有可能解锁显著的下游价值。
“应该更多地关注这些真正深层次的问题,通过理解该特定过程内现实的物理性质,”Angus 说。”这意味着做艰苦的工作来提取那些数据,然后在其上训练模型。”
这可能是一条较慢的路径,但这通常是最深技术理解的构建方式。