张强锋教授:人工智能与生命科学的深度融合

张强锋教授探讨了人工智能如何推动生命科学的发展,尤其是在蛋白质结构解析方面的影响。

原文标题:清华大学生命科学学院张强锋教授:AI 理解生命科学的海量数据,解析复杂调控网络

原文作者:数据派THU

冷月清谈:

在第六届北京智源大会的「AI for Science」论坛上,清华大学生命科学学院的张强锋教授分享了人工智能如何革命性地加速生命科学的发展。他具体阐述了AI在解析蛋白质结构及理解生命科学中的核心作用。教授指出,现代生命科学面临海量复杂数据的挑战,而AI提供了强大的工具,使科学家能够解析复杂的调控网络,理解基因和疾病的关系。张教授还回顾了生命科学的发展历程,从博物学到现代分子生物学,强调了AI在未来生物医学中的重要性。引人注目的是,AlphaFold作为AI应用的代表,已在蛋白质结构预测方面取得显著成就,期待未来能获得更多的科研奖项。通过这种跨学科的结合,生命科学的研究将更为高效和深入。

怜星夜思:

1、AI能解决生命科学中的哪些具体问题?
2、人工智能的快速发展对科学研究方法的影响有多大?
3、未来人工智能在生命科学领域的前景如何?

原文内容

本文约2000字,建议阅读7分钟

正如微积分推动了现代力学的建立,技术是推动科学进展的重要动力。


清华大学生命科学学院、清华-北大生命科学联合中心研究员、博导张强锋教授在第六届北京智源大会的「AI for Science」论坛上以「当人工智能遇上生命科学」为题,分享了如何利用 AI 结合冷冻电镜实现蛋白质结构的解析。

「人工智能技术的进展,给生命科学带来了革命性的突破,能够让我们有机会理解生命科学的海量大数据、解析生命科学的复杂调控网络。」

在第六届北京智源大会的「AI for Science」论坛上,清华大学生命科学学院、清华-北大生命科学联合中心研究员、博导张强锋教授以「当人工智能遇上生命科学」为题,分享了如何利用 AI 结合冷冻电镜实现蛋白质结构的解析。

小编在不违原意的前提下,对张强锋教授的深度分享进行了整理汇总,以下是演讲实录。

AI for Science 是 AI 应用非常重要的方向之一。Science 需要理解这个世界,AI 可能是其中一个非常重要的途径,在这方面具有非常大的发展潜力。

我将为大家介绍 AI 和 Life Science 的发展历程与趋势,Life Science 是 Science 非常重要的一个门类,主要聚焦在生物医药方面。

生命科学发展历程

人们生活在这个世界上,青春和健康是所有人永恒的梦想,所有人都关心 Life Science。

这是高更的一幅画,画的是一个人一生的过程,从婴童到成年,再到最后步入老年,这个过程是每个人的必经之路,在这个过程中人们有各种各样的生命健康问题,而 Life Science 就是要理解生命健康的问题,并且寻找到一些疾病的应对方案。Life Science 发展历史悠久,可以说是自然科学里面最重要的分支之一。

客观来讲,人类从几百年前才真正进入科学时代,Life Science 的第一个发展阶段就是博物学时代,大家通过在地球上采集各种各样不同的物种、研究它们的关系,开始理解生命从何而来,这个阶段的发展顶峰应该是达尔文进化论的出现,可以看作是生命科学、生物学的 1.0 版。

进入现代以后,人们研究世界的视角开始走向微观,逐渐能够从分子、基因的角度理解宏观生物学背后的微观机制。所以,生命科学 2.0 版是分子生物学,它的顶峰是 DNA 双螺旋结构的发现和解析,人类借此才开始真正理解生命遗传的奥秘。

Francis Harry Compton Crick 不光解析了 DNA 双螺旋,还建立了中心法则,对生命科学有纲要性的指导。从 DNA 到 RNA 再到蛋白质,人们好像建立起了现代生命科学的大厦。而正像一百多年前,人们觉得已经建立了完美的物理学大厦,但却始终觉得有两朵乌云在物理学大厦上面飘荡。生命科学遇到的问题更复杂、更庞大。

现代生命科学在最近 20 年左右开始进入高速发展时代,产生了非常多的数据,包括不同组学、方面、层次、维度,从基因到细胞,再到组织、个体,可以说是真正的海量大数据。

这个时候,大家开始意识到生命科学研究的复杂性。例如一个基因可能受环境和其他基因的影响,一个基因如果发生变化也会影响到很多性状。人们研究一个基因的时候,会涉及到更加广泛的知识,所有基因和所有疾病或多或少都存在联系。正因如此,人们真切感受到了生命科学的复杂性,绝对不仅仅是中心法则就能概括的。

AI 解析复杂的生命科学

正如微积分推动了现代力学的建立,技术是推动科学进展的重要动力。类似的,我觉得生命科学的发展也需要有新的数学工具和新方法。人工智能的发展给生命科学带来了革命性的突破,能够让人们有机会理解生命科学的海量大数据、解析生命科学的复杂调控网络,也是研究生命现象、生命系统的强有力工具。

2016 年 3 月 15 日,AlphaGo 打败李世石,这是个历史的瞬间。我在机场听到这个新闻后,心潮澎湃地写下了一段话:A moment comes, which comes but never in human history, when the earth civilization steps out from the old to the new, when the human age starts to end, and when a new type of intelligence, to be long glorified, finds its first utterance.

今天我们所讲的人工智能,很多时候指的是以深度学习为代表的、比较狭义的技术,但其实人工智能本身是一个广义的定义。

大家之所以关注到了人工智能,主要是因为这十多年来其获得了突破性的进展,从最开始的图像识别,再到刚才提到的 AlphaGo,再到大家如今所熟知的 ChatGPT 等大语言模型。

AlphaFold 可以说是 AI for Science 最突出的代表,使用人工智能方法预测蛋白质结构,而且获得了接近于实验解析的准确度。所以,一定程度上可以认为,我们已经解决了蛋白质结构预测的问题。当然,各种各样的应用突破和科学突破的背后,依托的是丰富的技术进展。

回到生命科学本身,刚才说的 AlphaFold,也在去年获得 Lasker Award,历史上超过 50% 的 Lasker Award 都能够获得诺贝尔奖,我们也非常期待 AlphaFold 能够获得诺贝尔奖。

随着大语言模型的出现,人工智能进入到了一个新的发展阶段,从蛋白质设计到单细胞大模型的建立,甚至在基因表达调控网络解析方面,都已经产生了非常深远的影响。这些工作目前都在推进之中。

人工智能生物医学应该算是人工智能和生命医学的融合,会在各种不同的领域开枝散叶。

关于张强锋教授

张强锋教授

张强锋教授本科毕业于中国科学技术大学「少年班」,此后留校直到博士毕业,获得计算机博士学位。在 2006 年毕业的当年,27 岁的张强锋选择从零开始,远赴美国攻读哥伦比亚大学生物化学和分子生物物理系的博士学位,通过 5 年时间获得了第二个博士学位,随后在哥伦比亚大学和斯坦福大学医学院继续进行了 4 年的博士后工作。2015 年,张强锋回国任清华大学生命科学学院助理教授,2018 年至今任清华大学生命科学学院副教授,同时也是清华大学结构生物学高精尖创新中心 PI,曾获拜耳研究员奖、杨森研究员奖。

张强锋教授主要致力于新兴的人工智能和生命科学交叉领域研究,主要通过结合人工智能和大数据分析,进行结构生物学、基因组学、RNA 生物学等技术开发和科学问题研究,研究兴趣包括并不限于 RNA 结构组技术及算法、单细胞基因组测序技术及算法、基于冷冻电镜的蛋白质结构建模等。另外,张强锋教授还对一些人工智能算法开发特别感兴趣。特别是,现阶段人工智能方法能解决什么生命科学问题、生物医学数据的人工智能方法有哪些特殊的不同于其他人工智能领域之处、人工智能是否会带来生命科学研究的新的范式。

编辑:黄继彦




关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU



AI在解析复杂的基因表达数据方面显得尤为重要,它可以帮助科学家识别哪些基因在特定条件下发挥关键作用。

我认为AI在药物研发中也大有可为,例如通过分子模拟和结合分析,加速新药的发现过程。

具体问题包括肿瘤基因组学,AI能够分析大量的突变数据,发现肿瘤的驱动基因,这是人工作业难以实现的。

AI改变了我们处理数据的方式,以往的实验模型也必须适应新的技术,这确实会促进方法论的革新。

在科学研究中,以后更多会采用计算建模的方法,实验也许会变得更加依赖于数据分析,而非简单的实验观察。

不过,我觉得我们不能完全依赖AI,科学的直觉和创造力依旧是推动发现的关键。

前景无疑是光明的,特别是在个性化医疗和基因编辑等领域,AI的应用可能会改变我们的治疗策略。

随着AI技术的发展,未来的科学发现速度会大幅提升,这让人充满期待!

关键还是在于伦理和可控性,如果我们能合理运用这些技术,前景一定会很美好,但我们也必须小心翼翼。