PINN、神经算子与仿真的未来

标题：物理信息神经网络、神经算子与仿真的未来

物理信息神经网络、神经算子与仿真的未来
安妮丽丝·甘布尔
2026年3月3日
8 分享
这是由两部分组成的系列文章的第一部分。这仍然是我正在学习的领域。我的理解尚处早期阶段，因此请将本文视为我对近期与该领域专家交流以及个人阅读和聆听内容的探索。

许多工程工作的核心在于求解描述物理系统行为的数学问题——例如应力、热量、气流、扩散、振动。工程师运行仿真（使用SolidWorks/ANSYS/COMSOL等软件），试图将这些现实世界的变量转化为可解的数值问题。

来源：Gemini
如果人工智能能够学习其背后的规则（即输入“几何形状、材料和边界条件”，输出“会发生什么”），那么迭代过程将变得成本更低、速度更快。你可以更频繁地探索更大的设计空间，减少对专业人员的依赖瓶颈。随着时间的推移，仿真将开始嵌入设计工作流程中。CAD和CAE的界限将逐渐模糊。

关于这个话题，我与朋友马修·塔马约-里奥斯的一次对话对我最有帮助。他是苏黎世联邦理工学院的应用数学博士生，师从以科学机器学习（用于偏微分方程的机器学习/物理信息方法）闻名的西达塔·米什拉教授课题组。

以下是我开始研究这个领域以来所学内容的第一部分，包括我与马修对话的一些要点。

什么是物理信息神经网络？
物理信息神经网络由Maziar Raissi、Paris Perdikaris和George Em Karniadakis于2017年在一个由两部分组成的系列中提出（第一部分和第二部分），后于2019年整合发表于《计算物理学杂志》。物理信息神经网络的核心是尝试训练一个尊重物理定律的神经网络。它被训练以匹配数据，同时通过每当模型违反偏微分方程时在损失函数中添加惩罚项来确保其遵守物理规律。“你希望通过将其设置为一个最小化问题来编码物理定律，并让神经网络学习如何求解它，”马修告诉我。

物理信息神经网络基本上是一个可以查询的函数。例如，输入物体内部的一个位置和时间，它会告诉你该处的温度。关键在于它的训练方式。你同时从两个方面评估它：1）它是否与你已有的测量数据匹配；2）它是否遵守热传导的基本规则，包括在边界处必须满足的条件？如果它匹配数据但违反了规则，就会得到较低的分数。随着时间的推移，训练会推动它趋向于既符合数据又不违反物理定律的温度分布图。

在传统仿真中，计算机无法求解固体或流体内部每一点的物理状态，因此它将几何结构分解成许多微小单元（称为网格），并在这些离散点上求解方程。然而，网格处理很麻烦，因为求解结果的质量很大程度上取决于网格的划分方式。“你的网格决定了仿真的粒度……在网格节点之间，你只能得到近似解，”马修说。如果网格太粗糙，你会错过尖锐、重要的效应。如果网格太精细，仿真会变得缓慢且昂贵。而且如果设计发生改变，你通常需要重新构建网格并从头开始。

在物理信息神经网络中，尽管你仍然有离散化的采样点，但你不需要网格，因为神经网络本身就是一个连续的求解函数。神经网络就像一个平滑的地图，你可以在任意点进行查询。在训练过程中，你直接从模型中计算检查物理规律所需的量（如变化率），然后每当物理规律不满足时就施加惩罚。它偏离方程的程度就是偏微分方程的残差。

为何物理信息神经网络曾如此令人期待？
大多数现实世界的工程问题始于部分信号和大量未知数。你可以测量某些东西，但无法测量全部（材料属性、精确载荷、边界处的真实情况、热量的实际来源、少数噪声传感器之间发生的情况）。你基本上是从可观测的现象反向推导底层发生的过程。

物理信息神经网络让你无需大量标注数据集就能进行物理建模。它们是一种利用你已有的任何数据来训练模型的方法，同时该模型还受到物理规则的约束。当你已经知道控制结构并愿意为特定系统定制设置时，它们通常是构建近似解的好方法。正如马修所说，它们可以“相对容易地设置为特定系统的神经代理模型”。

这就是它们最初看起来如此有前景的原因。

物理信息神经网络的困境
“物理信息神经网络有一系列失效模式，”马修告诉我。一个主要问题是神经网络倾向于先学习平滑、简单的模式，而难以处理尖锐、快速的变化。换句话说，它们通常能把握整体形状，但会错过某些重要细节，如薄边界层或湍流。

另一个问题是训练可能很困难。你要求模型同时做几件事：匹配你拥有的任何数据、遵循控制方程、满足边界条件。这些要求可能相互冲突。模型可能会通过满足简单部分来“作弊”，而在物理上仍然是错误的，特别是在刚性或混沌系统中。

这就是为什么简单版本的物理信息神经网络在我们关心的现实世界场景中不够可靠和鲁棒。

神经算子：思维方式的转变
神经算子的理念是，与其训练一个模型来预测特定设置的解，不如尝试学习从问题描述到完整解的映射。你输入定义问题的内容（例如边界条件、初始条件、参数），然后模型输出整个解场。马修的工作重点就在于此。正如他所说：“我的目标是开发一个无网格的物理信息算子学习模型。”

马修将“算子学习”定义为“一种接受任何输入函数或场并将其映射到解函数或场的方法。你给它边界条件、初始条件和偏微分方程，它将其映射到随时间变化的解。” 你学习的是从问题设置到完整答案的映射。

最著名的例子之一是傅里叶神经算子。其思想是，它学习解算子——一种从边界/初始条件到完整解的映射——这种方式比传统的代理模型（通常绑定于特定网格）能更优雅地跨分辨率迁移。FNO风格的模型在标准偏微分方程基准测试中表现出色，在某些情况下，在一个分辨率下训练的模型可以在更精细的分辨率下进行评估而无需重新训练，即零样本超分辨率。

这并不能保证它在每一个混乱的现实世界场景中都有效，而且你通常并不真正知道你正在求解的偏微分方程的确切参数。但这是第一次让人感觉像是预训练：“你第一次花很多时间训练它，然后你可以将其应用于不同类型的问题，”马修告诉我。

物理基础模型
由此，离物理基础模型只有一步之遥：在广泛的偏微分方程族或物理系统上进行预训练，然后针对下游任务进行微调。你在气候领域（例如ClimaX）以及旨在更通用的新型算子学习工作中看到了早期版本。

马修指出Poseidon是这一方向的早期尝试之一。“这是首批能够泛化到未见过的物理现象，并且易于迁移到新几何形状和新参数体系的基础模型之一。”然而，马修也提醒说：“它仍然假设结构化网格，需要大量数据，训练耗时极长……而且当物理变得复杂时，它就开始遇到困难。”

这些提醒指出了物理基础模型不断出现的两个问题。首先，它们需要海量数据，尤其是在三维情况下。马修的粗略估算：在每个维度上以128个点采样一个三维体积，每个时间步长就已经达到约200万个点。运行数千个时间步长，数据集会非常迅速地变得非常庞大。

另一个大问题是“在现实世界场景中，你并不知道你正在求解的偏微分方程是什么，”马修告诉我。你可能知道一般形式，但关键参数未知，并且不清楚你处于哪种物理状态。换句话说，你不仅仅是在给定偏微分方程的情况下求解。实际上，你是在给定部分物理知识、未知系数、操作条件模糊性和噪声数据的情况下尝试求解。这正是部署如此困难的原因。

综合来看，数据和未知变量这两个约束解释了为什么研究和生产之间仍然存在差距。将这些模型部署到实际环境中需要知道模型何时正确、何时错误以及如何校准它们。这也意味着将这些模型嵌入工程师已经使用的工具中，这在由少数几家现有厂商主导的生态系统中绝非易事。

在下周的帖子中，我将探讨如何弥合这一差距，哪些用例在今天已经实用，以及投资回报在哪里。信任、校准循环、工作流程所有权以及集成到工程师已使用的工具中是我计划涵盖的一些主题。

作者注：仅使用大语言模型进行轻度文本编辑（拼写、语法和清晰度）。内容、含义、语气和结构保持不变。

感谢阅读AI Opportunities！免费订阅以接收新帖子并支持我的工作。
订阅
8 分享

原文来源：AI Opportunities

#AI