清华学生利用大数据技术,构建高精度青藏高原径流预测模型,为气候变化下的水资源管理提供科学依据。
原文标题:大数据能力提升项目|学生成果展系列之六
原文作者:数据派THU
冷月清谈:
水利系钟亮金同学的成果展示了项目在实际科研中的应用。他聚焦气候变化下的青藏高原径流问题,利用深度学习方法结合物理模型,开发了高精度径流预测模型。
传统模型在青藏高原径流模拟中存在精度有限和参数化困难等问题。钟亮金同学针对这些问题,引入深度学习方法,并从两个方面进行创新研究:
1. 开发了考虑冰冻圈过程的物理引导的深度学习模型,该模型能够更好地捕捉径流对气候变化的响应,并揭示了耦合流域主导水文过程的物理机制可以增强深度学习在气候变化等非稳态情景下的应用的可靠性。
2. 开发了基于物理过程与深度学习耦合的分布式模型,该模型能够提高对子流域时空数据信息模式的利用效率,并充分利用流域内的所有可用径流观测进行约束,实现对物理过程模块的自动参数化和对机理认识不充分的冰冻圈过程的智能概化。
这些研究成果发表于Water Resources Research和Journal of Hydrology等期刊,并获得软件著作授权和专利申请。该模型对青藏高原水资源预测和缺资料地区径流模拟具有重要应用价值。
怜星夜思:
2、如何评价模型在数据稀疏地区(如青藏高原)的应用效果和可靠性?
3、除了径流预测,该研究成果还能应用于哪些领域或解决哪些实际问题?
原文内容
为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。
回首2024年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自8个院系的8位同学代表一起领略他们的风采吧!
代表性成果
变化气候下的青藏高原径流机理认识与高精度径流预报
水利系 钟亮金
1. 学术成果
青藏高原作为亚洲水塔,在气候变化下出现固态水加速液化的现象,冻土、积雪和冰川等冰冻圈过程严重退化,显著改变了该地区生态水文响应机制。传统基于物理的生态水文模型在揭示该地区径流响应气候变化的机理方面存在局限性,径流模拟的精度有限,其中的关键难题在于:(1)冰冻圈过程十分复杂,机理认识尚不充分;(2)青藏高原是全球实测资料最缺乏的区域之一,导致模型参数化困难。
针对问题(1),申请人引入深度学习方法对机理认识不充分的过程进行智能概化,开发了一个考虑冰冻圈过程的物理引导的深度学习模型。相较于集总式水文模型、分布式水文模型和纯粹的深度学习模型,本模型最能捕捉径流对于气候变化的响应。本研究还揭示了耦合流域主导水文过程的物理机制可以增强深度学习在气候变化下的可靠性,为深度学习方法在气候变化等非稳态情景下的应用提供了思路。
研究成果发表于行业旗舰期刊 Water Resources Research(中科院 Q1 TOP ,第一作者),获 2023 WRR Editors ’ Choice Award (Top ~1%)。
针对问题(2),申请人从两个方面开展了创新性研究:
第一,针对传统方法在数据稀疏区域的径流模拟精度受限的难题,申请人通过引入河道汇流的分布式结构,开发了一个基于物理过程与深度学习耦合的分布式模型。该模型能够基于深度学习方法提高了对子流域时空数据信息模式的利用效率,并充分利用流域内的所有可用径流观测进行约束,实现对物理过程模块的自动参数化和对机理认识不充分的冰冻圈过程的智能概化。相较于传统的分布式模型和迁移学习方法,该模型对实测径流数据的要求更低,但具有显著更优的模拟精度和时空泛化性能。研究成果发表于行业旗舰期刊 Water Resources Research(中科院 Q1 TOP ,第一作者),获得软件著作授权一项;
第二,针对实测径流数据不足、难以准确约束多过程模拟的难题,通过耦合了碳同化、碳分配和植被生长等生态过程,开发了一个基于多系统过程机理与深度学习耦合的分布式生态水文模型,使得该模型能够在实测径流数据的基础上进一步引入遥感 LAI 数据对模型进行训练。该模型使用耦合了生态水文多过程机理,利用站点实测和遥感多源观测数据进行约束,有效提高了少资料流域的径流模拟精度和鲁棒性,且能准确捕捉其他过程(如 LAI 和ET)的时空动态变化,能够为复杂冰冻圈流域的过程诊断和机理认识提供新视角。研究成果发表于行业权威期刊 Journal of Hydrology(中科院 Q1 TOP ,第一作者),申请发明专利一项(实质审查阶段)。
2. 实际应用价值
(1)申请人针对变化气候下、缺资料冰冻圈流域的径流模拟难题,开发了基于多系统过程机理与深度学习耦合、使用多源观测约束的分布式生态水文模型,大幅提高了现有径流模拟的精度,能够应用至整个青藏高原流域,对该区域内历史和未来的水资源做出准确预报,为下游国家和地区的水资源管理提供科学依据。同时,申请人开发的模型能够借助深度学习从大数据中智能学习机理认识不充分的过程,有望为青藏高原冰冻圈响应变化气候的过程诊断和机理认识提供新的视角。
(2)缺资料流域的径流模拟作为国际水文科学学会提出的十年计划之一,一直以来是水文水资源研究的难点。申请人开发的基于多系统过程机理与深度学习耦合、使用多源观测约束的分布式生态水文模型,相较于传统基于物理的模型和深度学习方法,能够在使用更少径流观测约束的情况下,取得精度更高、鲁棒性更强、时空泛化性能更强的径流预报结果,可为其他缺资料地区的径流模拟和水旱灾害预报提供新的解决方案。相关研究成果与中央气象台和智慧水利科技公司四信集团举办模型培训,并就后续落地应用进行洽谈。
编辑:文婧
校对:林亦霖