清华团队提出 UniCM:用统一模型学习全球气候模态耦合,提升长期气候预测能力

清华团队提出 UniCM,统一建模全球气候模态耦合,用 AI 提升长期气候预测与机制发现能力。

原文标题:清华大学李勇教授团队发文提出全球气候模态统一预测模型,为 AI 赋能气候科学提供新路径

原文作者:数据派THU

冷月清谈:

清华大学李勇教授团队提出全球气候模态统一预测模型 UniCM,相关成果发表于 Nature Machine Intelligence。不同于传统方法分别预测 ENSO、IOD 等单一气候现象,UniCM 将太平洋、印度洋、大西洋多个关键海气耦合模态放入同一框架,学习全球海洋—大气系统中的跨区域、跨尺度动力学关系。模型采用双分支多视角 Transformer:Globalformer 从海表温度、风应力、温跃层深度等物理场中学习时空演化,Modeformer 建模不同气候模态间的非线性作用,并通过耦合机制实现模态信息与物理场预测的双向反馈。实验显示,UniCM 在 ENSO 预测上优于多种基线模型,有效预报时效约 19 个月,并在一定程度上缓解“春季可预报性障碍”;对 IOD、TNA、NPMM 等多个模态也表现出更好的预测技巧。研究还利用注意力机制识别 ENSO 事件前兆和模态间遥相关线索,展示了 AI 不仅能提升预测精度,也可能成为气候机制发现工具。

怜星夜思:

1、如果 AI 能把厄尔尼诺这类现象提前一年多预测出来,普通人的生活会真的因此改变吗?
2、气候系统这么复杂,AI 学到的到底是物理规律,还是只是数据里的相关性?
3、统一预测多个气候模态,会不会反而让模型更难训练、更容易出错?
4、这类 AI 气候模型未来能替代传统数值气候模式吗,还是只能当辅助工具?

原文内容

图片


近日,清华大学电子工程系李勇教授团队提出全球气候模态统一预测模型 UniCM,面向 AI for Science学术前沿,当 AI 天气预报已经进入“算得更快、更准”的白热化阶段,将 AI 推向更深层的气候科学问题:突破传统气候预测方法从厄尔尼诺、印度洋偶极子等单一气候现象预测的局限,首次从“全球耦合系统”的视角统一学习海洋-大气模态之间的复杂动力学关系,为全球气候系统层面理解、极端气候事件预警和 AI 驱动的气候科学发现提供了新的方法路径。


从“预报天气”到“理解气候”


近年来,人工智能重塑天气预报领域:Pangu-Weather、GraphCast、GenCast、Aurora等模型陆续问世让AI在数天至数周的全球天气预报中,能力逼近甚至超越传统数值模式,能更高效精准回应“未来天气走向”。


然而,气候科学面临的是另一个更深层的问题:未来数月、数年甚至数十年,全球气候系统会发生什么变化?诱发什么异常?太平洋上的厄尔尼诺–南方涛动(ENSO)、印度洋上的偶极子(IOD)并非孤立存在,而是与热带北大西洋(TNA)、北/南太平洋经向模态(NPMM, SPMM)等多个模态一起,通过"遥相关"交换能量,构成一个相互联动的全球系统,共同影响季风、干旱、洪涝、海洋热浪和复合极端事件。


如何让 AI 不只预测短时的天气,而是探索地球科学的经典难题——理解这些气候模态之间的长期耦合关系?既给出更长时效的预报,又反过来揭示其中的物理耦合,这是 AI for Science 走向气候基础研究的关键挑战。


把全球气候模态作为一个系统来学习


针对这一挑战,研究团队提出 UniCM:不同于传统方法分别预测单一气候模态,UniCM 将太平洋、印度洋和大西洋中的多个关键海气耦合模态放入同一个统一框架中学习,把全球海洋大气系统看作一个相互作用的复杂系统。


UniCM 的核心设计是双分支多视角 Transformer 架构。Globalformer 分支"自下而上"地从海表温度、风应力、温跃层深度和上层海洋温度等精细物理场中学习气候系统的时空演化规律,刻画大尺度气候模态如何从底层物理场中“涌现”; Modeformer 分支则"自上而下"地学习多个气候模态之间的时间演化和非线性作用,形成对全球气候系统状态的高层表达。


更重要的是,UniCM 通过跨视角耦合机制,将模态层面的系统信息反向注入物理场预测过程。这使模型能够同时学习“物理场生成气候模态”和“气候模态调控物理场”的双向反馈关系,从而捕捉气候系统中长期存在但难以显式建模的跨尺度耦合机制。


UniCM 总体架构。底部 Globalformer 分支处理精细物理场(自下而上),顶部 Modeformer 分支建模气候模态间的非线性相互作用(自上而下),二者通过耦合机制协同。(论文 Figure 1)


释放隐藏在耦合中的“涌现可预报性”


研究结果显示,UniCM 在ENSO预报任务上达到领先水平。在 GODAS、ORAS5、SODA 等再分析数据集上的检验显示,UniCM 在 24 个月的预报窗口内,预报技巧优于XRO(Nature, 2024)、CNN(Nature, 2019)、ResoNet(AAS, 2024)、DESN(NPJ-CAS, 2026)等代表性基线模型,把厄尔尼诺的有效预报时效延长到约 19 个月。对于起报于春季的预测,模型在长达 14 个月的提前期内仍保持 ACC>0.5,在一定程度上缓解了长期困扰季节预报的“春季可预报性障碍”。在历史事件上,模型较好地回报了 1997–98 年厄尔尼诺与 2020–2023 年“三重”拉尼娜的强度、时序与演变。这说明 UniCM 并不是简单记忆气候指数曲线,而是在学习支撑不同类型气候异常事件发生、持续和衰减的系统性动力学关系。


UniCM 的 ENSO 预报表现。相比各基线模型,UniCM 在各预报时效上保持更高的预报技巧,并较好地回报了历史上多次厄尔尼诺与拉尼娜事件。(论文 Figure 2)


UniCM 的优势不止于ENSO这一个模态。在统一框架下,研究对横跨太平洋、印度洋、大西洋的七个关键海气耦合模态(ENSO、IOD、IOB、SIOD、SPMM、NPMM、TNA)进行了系统评估。这些模态中不少受复杂区域过程驱动、随机性更强、预报难度更高。结果显示,UniCM 在多个模态上整体优于代表性基线(如线性的 XRO 与基于储备池计算的 DESN):对印度洋偶极子(IOD),有效预报时效约为 7 个月,在多个关键模态上的预报技巧整体提升约 20%。此外,UniCM准确重建了观测中各模态问的滞后结构,如北太平洋经向模态(NPMM)领先ENSO约4个月的关系。这证实模型捕捉到了真实的物理耦合,而非数据中的偶然关联。分析表明,各模态的“可预报性窗口”并非孤立存在,而是受到模态间相互作用的影响,联合建模因此有助于揭示单独预测时不易观察到的系统性耦合。这一结果表明,气候系统的长期可预报性并不只存在于单个气候现象本身,而是隐藏在多个气候模态之间的相互作用中。UniCM 通过直接学习这些耦合关系,释放了传统单模态预测方法难以利用的“涌现可预报性”。


UniCM 对全球多个气候模态的预报表现:(a)各模态平均预报技巧;(b)逐月预报技巧;(c–d)NPMM 与 TNA 的预报技巧随提前期的变化;(e–g)模型对模态间滞后相关结构的重建。(论文 Figure 3)


让 AI 成为气候科学发现工具


UniCM 的突破不仅在于“预测更准”,还在于让 AI 具备了发现气候机制线索的能力。


UniCM 内部的注意力机制为其决策过程提供了一张可解释的"地图",通过分析模型内部注意力机制,研究团队发现 UniCM 能够识别重大 ENSO 事件发生前的关键空间前兆和模态间相互作用。例如,模型识别出NPMM在 1997 年厄尔尼诺事件前的重要先导作用,也发现TNA在部分复杂多模态异常事件中的枢纽作用。这一结论与已有的气候遥相关研究相互印证,完全可由模型预测结果中导出,意味着 UniCM不只是一个"黑箱预测器",而可以作为面向气候系统的科学发现工具。它能够助力研究人员从海量气候数据中发现潜在关系,提出新的机制假设,并进一步推动对全球海洋-大气系统的理论理解。


UniCM 的注意力机制揭示重大 ENSO 事件的前兆信号。上排为不同事件年的空间注意力分布,下排为模态间相互作用矩阵。(论文 Figure 5)


AI for Science 

迈向气候基础研究的新一步


当前,AI for Science 正从单点任务加速走向全流程科学发现。AI Scientist、AI Co-Scientist 等系统正在探索如何让 AI 参与假设生成、实验设计和理论解释。UniCM 则展示了这一趋势在气候科学中的重要方向:让 AI 从“会预测”走向“能解释”,从“计算工具”走向“科学发现伙伴”。


该研究表明,面对气候系统这类高度复杂、跨尺度、非线性的地球系统问题,人工智能的价值不仅在于提高计算效率,更在于发现隐藏在复杂数据背后的系统演化规律。通过学习全球气候模态的耦合动力学,UniCM 为长期气候预测、极端事件早期预警和地球系统科学发现提供了新的技术手段,为可再生能源、渔业、农业与防灾减灾等提供更长的决策提前量。


未来,该框架有望进一步扩展到季节内振荡、年代际变化以及全球变暖背景下的气候模态关系演化问题,为理解复杂气候系统、提升气候风险预警能力和满足国家防灾减灾需求提供智能支撑。进一步,当 AI 能够直接从数据中学到复杂地球系统的耦合规律时,它所能服务的便远不止气候模态预报:从极端天气的临近预报,到碳循环与海洋生物地球化学,再到生态系统与人类社会之间的相互作用,一个由观测、数值模拟与机器学习共同驱动的地球系统科学新范式正在形成。它所追求的,既是更准的预测,也是对我们赖以生存的这颗星球更深的理解。





论文信息

相关研究成果以“学习全球气候模态的耦合动力学”(Learning the coupled dynamics of global climate modes)为题,发表于《自然 ∙ 机器智能》(Nature Machine Intelligence)。清华大学电子系2020级博士生苑苑为论文第一作者;北京师范大学樊京芳教授、清华大学电子工程系李勇教授为论文共同通讯作者。清华大学电子系博士后研究员丁璟韬,北京师范大学系统科学学院博士生邱仲普为共同作者;研究得到国家重点研发计划,国家自然科学基金,清华大学-丰田研究院联合基金等项目的支持。


论文链接:

https://www.nature.com/articles/s42256-026-01245-5


来源:清华大学电子工程系



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU



我觉得最靠谱的路线是混合模式:物理模型负责守住基本规律,AI 负责加速、校正偏差、识别复杂遥相关。就像自动驾驶不是把交通规则扔了,而是在规则和数据之间找平衡。气候系统更复杂,更不适合单押某一种方法。

3 个赞

说“生活会不会改变”,得看预测能不能进入决策链。模型论文再漂亮,如果地方部门不用、数据更新不及时、预警传达不到位,那就是实验室里的满分作文。真正改变生活的不是一个模型,而是模型+制度+执行。

1 个赞

针对“统一建模会不会更难”这个问题:肯定更难。多个模态的时间尺度、区域特征、噪声水平都不一样,硬塞进一个模型很可能互相干扰。但文章的思路是利用它们之间真实存在的耦合关系,让一个模态的信息帮助另一个模态预测。如果耦合建模做得好,难度会换来额外信息。

3 个赞

回答“AI 学到的是规律还是相关性”:严格说,深度学习模型先学到的一定是统计关系,但这不代表它只能停留在相关性。关键是这些关系能不能跨数据集、跨年份、跨事件稳定成立,还能不能和已有物理机制互相印证。文章里提到 NPMM 领先 ENSO 的关系能被重建,这类结果会让人更相信它不是纯蒙。

3 个赞

多任务学习经常有这个矛盾:相关任务一起学,效果会提升;不相关或者数据质量差的任务一起学,就会互相拖后腿。气候模态之间有遥相关,这给 UniCM 提供了合理性。但它未来肯定还要面对一个问题:哪些模态该放一起,哪些不该放一起?不是越大越统一就越好。

2 个赞

我觉得可以类比一下:AI 像一个超级会看病历的实习医生,能发现“某些症状经常一起出现”,但病因机制还需要专家、实验和理论来确认。UniCM 的价值可能就在于把以前不容易注意到的遥相关关系拎出来,让气候学家继续追问。

3 个赞

完全替代估计还早。气候变化背景下,未来分布可能和历史不同,AI 如果主要依赖历史数据,外推会有风险。比如全球变暖改变了海温背景态,过去的 ENSO 规律未来是否还一样?这个问题光靠数据拟合不一定稳。

1 个赞