清华大学提出GridMix方法,突破深度学习求解偏微分方程瓶颈,融合全局结构建模和局部细节捕捉,在稀疏空间域和时间外推场景下表现卓越。
原文标题:ICLR 2025 Oral|突破深度学习求解PDE的瓶颈,清华提出空间调控新范式GridMix
原文作者:机器之心
冷月清谈:
怜星夜思:
2、文章提到GridMix在稀疏空间域和时间外推方面表现出优越的鲁棒性,这在实际应用中具有重要意义。那么,除了文中提到的Naviers-Stokes和Shallow-Water,GridMix还有可能在哪些实际场景中发挥作用?
3、GridMix的核心在于将空间调控参数表示为网格基函数的线性组合。这种方法在提升模型性能的同时,是否会引入额外的计算负担?未来可以从哪些方面进一步优化GridMix,以降低计算成本?
原文内容
-
保留了空间调控的细粒度局部性,确保建模精度;
-
同时通过共享基函数提取全局结构信息,有效缓解了过拟合风险。
-
论文标题:GridMix: Exploring Spatial Modulation for Neural Fields in PDE Modeling
-
论文地址:https://openreview.net/forum?id=Fur0DtynPX
-
项目主页:https://github.com/LeapLabTHU/GridMix.git
本文研究聚焦于偏微分方程(PDE)建模任务,其核心是近似算子
。该算子根据底层 PDE,将输入空间
中的函数映射到输出空间
。此处
表示定义域为且值域为
的平方可积函数构成的无限维空间。我们重点研究以下两类典型任务:
-
动态系统建模:旨在捕捉物理系统在预测时间范围内的动态演化过程。具体表现为建模系统从状态
到状态
的转移过程,其中
表示时间步长。 -
几何感知预测:根据系统的几何构型预测其状态。
,测试时则采用与训练域不同的空间域来评估模型性能。需特别说明的是,
和
均为完整域
的子集。
和
分别对输入和输出函数进行参数化建模。这些神经调控场作为基础模型,通过不同调制参数实现对不同函数的重构。具体而言,INR 参数
和
在各自函数空间中共享,而调制参数和则是每个函数特有的。这些调制参数通过超网络
,
。经训练后,每个函数可由低维调控向量经过共享 INR 重构,其重构误差代表了表示质量。在第二阶段(预测阶段),CORAL 通过处理网络![]()
是网络权重和偏置,
为固定的放缩因子,
,
是空间坐标![]()
表示第 i 层的调制参数。需要注意的是,这种全局调控参数
,其中H和W分别表示网格的空间分辨率(以二维空间为例)。我们可以从该网格特征中提取位置相关的调控参数
。具体步骤如下:给定空间位置
。空间调控对应的平移调控方法可表示为:

。这里
表示 M 个网格基函数,
为第 i 层的线性组合系数。这些系数通过超网络 h 从低维调控向量 z 中估计得到。网格基函数在不同的函数实例中共享,并与神经调控场一同优化。GridMix 具有以下特点:
-
局部细节捕捉:GridMix 保留了网格调控的局部特性,通过引入额外的可学习参数增强了模型在局部细节重建的表达能力;
-
全局结构建模:GridMix 通过共享基函数对调控空间起到正则化作用。相比一般空间调控需要为每个函数额外学习个
独立参数,GridMix 将参数维度降低至基函数的个数。这种维度压缩有效减少了过拟合的风险,提升了模型对全局结构的重建能力,以及在不同空间域上的泛化能力。
图 5. 稀疏空间域下的 Shallow-Water 可视化结果
几何感知推理
在几何感知推理中,模型根据给定的几何结构(例如翼型(NACA-Euler)、水管(Pipe)和弹性材料(Elasticity))预测系统的状态。相较于全局调控方法,GridMix 在所有任务中均实现了性能提升。
图 6. 几何感知推理任务
-
提出了一种新颖的空间调控方式 ——GridMix,它自然地融合了全局调控的全局结构建模和空间调控的局部细节捕捉能力;
-
在动态系统建模和几何感知推理等任务中充分验证了 GridMix 的卓越性能,特别是在稀疏空间域和时间外推场景下优势显著。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:liyazhou@jiqizhixin.com








