清华学子分享如何通过大数据和AI技术,解决能源动力领域难题,实现AI与能源的深度融合与创新。
原文标题:吴家豪:为 AI 赋“能”,为能动赋智 | 提升之路系列(四)
原文作者:数据派THU
冷月清谈:
怜星夜思:
2、文章中吴同学提到了数据伦理的重要性,你认为在AI应用于能源领域时,可能存在哪些伦理风险,我们应该如何应对?
3、吴同学的研究经历了从“纯物理驱动”到“纯数据驱动”再到“数理联合驱动”的范式转变,你认为这种转变对其他领域的科研工作者有哪些启示?
原文内容

导读
导读
为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。
在入学伊始,我一边认识到作为能动学子的碳中和使命之重,一边感受到人工智能和大数据在新一轮科技革命和产业变革中的引领性作用,因此,紧跟能源动力行业的碳中和浪潮,抢抓人工智能发展的历史性机遇,成为“AI+能动”的交叉复合型人才,成为了我的读博主旋律。在这样的动机下, 我于 2021 年秋季学期报名了大数据能力提升项目,按要求完成了理论学习和实践,提升了大数据能力和素养,并用智能技术解决了诸多能源动力领域的问题。
在项目学习方面,我修读了项目的四门课程。在大数据系统基础(A)课程中,我学习了常见的大数据管理系统和计算系统,并在企业实践作业中搭建了风力发电机齿轮箱的故障检测系统,实现了数据读取、清洗、训练基线模型、故障检测等功能。在深度学习课程中,我学习了各种神经网络模型和先进 AI 技术,并在课程大作业中了解到物理信息机器学习,用其解决了简单的流动和燃烧问题,开启了我的科学机器学习之路。在大数据实践课中,我参与光伏发电系统异常分析及功率预测的实践项目,使用最前沿的时序预测 AI模型,实现了光伏电站的短期功率预测,并获得了实践课的优秀团队奖。最后,在数据伦理课程中,我认识到大数据和人工智能治理的重要性,并在课程大作业中全面调研了人脸识别的各类伦理问题及其治理。
大数据实践课合影(第二排左三)
在学术科研方面,我依次开展先进动力高效模拟、清洁能源智能预测、物理信息机器学习的研究,不只是单纯的为能动赋智,让能动更可“AI”,更是为 AI 赋“能”,让 AI 更懂能动。
先进动力高效模拟(纯物理驱动)。首先,我开展了先进动力高效模拟的研究,在其中对管壳式蒸汽冷凝器开发了一套高效的准三维模拟算法。这项研究属于纯物理驱动的范式,它让我认识到纯物理模拟固然可靠,但对模型的依赖性强,而很多时候我们没有模型,但有大量数据,其典型场景之一就是清洁能源的智能预测,这也是我第二部分的研究,是在大数据实践课中开启的研究。
清洁能源智能预测(纯数据驱动)。太阳能光伏装机持续增长,但其波动性影响电网的安全稳定运行,因此,对光伏功率进行预测,对于新型电力系统有重要意义。然而,传统数值和 AI 模型预测能力有限,而 Transformer 系列模型作为 AI 发展的里程碑,在时序预测方面也发展迅速,因此,我率先将这一最前沿 AI 模型应用于实际光伏功率预测。基于三种最新的 Transformer 模型,我考虑工业实际,设计了三种不同成本下的预测方案,对湖北某光伏电站进行短期功率预测。我也根据预测达标情况,为工业界提供了推荐模型和配置,并发表了一篇英文期刊论文。
物理信息机器学习(数理联合驱动)。纯数据驱动缺乏了物理知识的可靠性。相比纯数据驱动和纯物理模拟,更普遍的场景是数据和物理共存,这时候需要将两者相结合,也就是物理信息机器学习(PIML)。因此,我为 AI 赋“能”,构建嵌入能动物理知识的可靠 AI,让 AI 更懂能动,从而更好地解决能动难题。以射流火焰转捩为例,它是能源动力领域中一个典型、基础且复杂的流动燃烧问题,为了对其进行预测,射流的强剪切、燃烧的多物理、转捩的多尺度,都给PIML算法带来巨大挑战。针对这三类问题,我分别研究出了适用于薄层流动、层流火焰和转捩流动PIML算法。对于薄层流动,包括射流、尾流、边界层等, 它们是更复杂流动的基础单元。
为了缓解薄层难题,我提出了变量线性变换改进的物理信息神经网络,创新性地从方程的角度而非模型或优化的角度进行改进,并在所提出的参数选取原则中充分考虑了薄层流动的物理特点,做到了 AI 和知识的双向耦合。对于层流火焰,有限速率化学的强非线性和问题特征值的不适定性,使得当时没有人使用PIML 成功求解这类问题。我开发了 FlamePINN-1D 框架,首次基于 PINN 和详细物理模型求解不适定燃烧问题,并在其中设计了多处物理约束策略。对于转捩流动,K-H 转捩是剪切流动的基础,但其多尺度、多流态等特点使得原始PIML 算法难以求解。我提出了KH-PINN 模型,嵌入不可压缩流动方程,进行 KH 转捩的流场重构,并设计算法分别解决了时空多尺度和量级多尺度带来的困难。以上工作都已经发表在计算物理和能源动力领域的权威期刊,并在多个学术会议上进行报告。另外,我还撰写了一篇PIML+燃烧的系统综述,详细梳理了 PIML 的基本原理以及在各类燃烧场景中的应用。
总之,所开展的五部分研究工作走通了数据-物理这条轴的两端和中间,有效拓宽了 PIML 方法在复杂流动燃烧中的适用边界,成果有力支持冷凝器设计、新能源运维、射流火焰转捩等实际工业场景的问题解决,而在其中所依靠的大数据和 AI 的思维和技能,都离不开大数据能力提升项目。
在希腊参加第一届国际 AI 流体力学会议
在西安参加首届全国智能流体力学会议
在其他方面,我也积极践行“AI+能动”和智慧能源的初心。首先,我也报名了学校的碳中和能力提升项目,在某课程中对数字智能技术助力碳中和进行深度调研,梳理了在低碳智慧能源体系中数字智能技术在能源开采生产、输送存储和消费使用环节的应用与研究。 其次,在 2023 年的博士生必修实践中, 我紧跟年初热门的ChatGPT,对中文大语言模型进行调研,梳理其语言要素、场景要素和技术要素, 概述行业现状,整理现有模型及其配套资源,为公司给出发展建议。另外,在竞赛方面,我曾组队参加首届世界科学智能大赛,挑战湍流重构难题,并指导本科生科创,所开发的流体智能求解器获得了校级挑战杯二等奖、能动设计大赛一等奖、中国青年科技创新“揭榜挂帅”擂台赛一等奖等奖项。最后,我曾前往苏黎世联邦理工学院数学系访问三个月,从事科学机器学习的合作研究,将最前沿的科学 AI 模型应用于流动和燃烧问题中。



