江南大学提出MINDG:深度学习与图学习结合的药物-靶点相互作用预测新方法

江南大学提出了MINDG,一个结合深度学习与图学习的药物-靶点相互作用预测新方法,显著提升预测性能。

原文标题:准确预测药物-靶点相互作用,江南大学提出深度学习融合GNN新方法MINDG

原文作者:数据派THU

冷月清谈:

江南大学的研究团队提出了一种新的药物-靶点相互作用(DTI)预测方法,名为多视图集成学习网络(MINDG)。该方法通过集成深度学习和图学习有效提取药物和靶点的结构特征及其之间的关系,克服了传统方法在一阶邻接节点信息利用上的局限性,并首次引入了高阶图注意力卷积网络(HOAGCN)。实验表明,MINDG在多个数据集上表现优越,明显提高了DTI的预测性能。此外,MINDG还被用于抗病毒药物的再利用研究,显示出实际应用价值。尽管已有显著进步,MINDG的内在结构信息利用仍有待加强,未来计划进行湿实验以验证其效果。

怜星夜思:

1、MINDG相比传统方法的优势有哪些?
2、未来的药物发现研究中,你认为还有哪些技术突破是必要的?
3、你认为图学习在药物研究中的潜力如何?

原文内容

图片
来源:专知

本文约1700字,建议阅读5分钟

江南大学研究团队提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。



药物-靶点相互作用(DTI)预测在药物发现中发挥着重要作用。尽管药物靶点预测的智能计算方法受到了广泛关注,并取得了许多进展,但仍然是一项具有挑战性的任务,需要进一步的研究。
为了解决上述挑战,江南大学研究团队提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。
MINDG 结合图学习和深度学习来提取药物和蛋白质的内在结构信息,以及它们之间的外在关系信息。因此,与之前的方法相比,MINDG 提高了模型预测的性能。
相关研究以《MINDG: a drug–target interaction prediction method based on an integrated learning algorithm》为题,于 2024 年 3 月 14 日发布在《Bioinformatics》上。
GitHub 地址:https://github.com/jnuaipr/MINDG
论文链接:https://doi.org/10.1093/bioinformatics/btae147

四种 DTI 预测方法


DTI 预测指预测给定的药物分子是否会与特定靶点结合,从而发挥靶向治疗作用。
目前 DTI 预测方法主要有四类:基于相似性的方法、机器学习方法、深度学习方法和图学习方法。
基于相似性的方法,例如,阿卜杜拉国王科技大学 (KAUST) Thafar 团队提出的 DTi2Vec 方法可以预测药物和蛋白质之间的联系,而无需挖掘药物和蛋白质的额外内部信息。
机器学习方法利用蛋白质结构和序列信息来预测目标。例如,使用化学结构、药物质谱和氨基酸序列来表示蛋白质以预测药物-靶标相互作用。
深度学习方法将特征、模型和生物信息学网络与其他方法相结合,以获得更好的预测结果。
目前,在 DTI 预测的可用方法中,基于图卷积网络(GCN)的方法最有前景。
药物靶标预测的智能计算方法受到了广泛关注并取得了重大进展。然而,这仍然是一项具有挑战性的任务。
主要挑战表现为:(i)大多数基于图神经网络(GNN)的方法只考虑图中一阶相邻节点(药物和靶标)的信息,而没有从高阶相邻节点中学习更深入、更丰富的结构特征。(ii)现有方法没有同时考虑药物和靶标的序列和结构特征,各方法相互独立,无法结合序列和结构特征的优点来提高交互式学习效果。

MINDG 提高了 DIT 预测性能


为了应对这一挑战,该研究提出了一种集成深度学习和图学习的多视图集成学习网络(MINDG)。
图示:MINDG 模型的总体架构。(来源:论文)
该网络由以下部分组成:(i)采用混合深度网络(HDN)提取药物和靶点的序列特征,(ii)提出了高阶图注意卷积网络以更好地提取和捕获结构特征,(iii)使用多视图自适应集成决策模块对上述两种网络的初始预测结果进行改进和补充,提高预测性能。
图示:混合深度网络(HDN)的结构图。(来源:论文)
该研究的贡献主要体现在三个方面:
  • 设计药物和蛋白质靶标图学习的注意力机制,并提出高阶图注意力卷积网络(HOAGCN)。
  • 融合消息传递神经网络 (MPNN) 和卷积神经网络(CNN)方法来增强药物和蛋白质目标序列的结构特征学习;。
  • 提出集成深度学习和图学习的多视图集成学习网络(MINDG)。
图示:高阶图注意力卷积网络(HOAGCN)的结构。(来源:论文)

实验研究


为了验证 MINDG 的有效性,在以下方面进行了实验分析:(i)与当前性能较好的药物-靶点相互作用预测方法的性能比较;(ii) 进行了消融实验;(iii) 进行了预测结果的应用研究。
在两个数据集上(BindingDB 和 DAVIS)评估 MINDG,表明与最先进的基线相比,它提高了 DTI 预测性能。MINDG 结合了图神经网络和深度学习方法的优点,比单独使用任何一种方法都有更好的性能。
接下来,进行了消融分析,研究了多视图学习对预测性能的影响。
从实验结果中可以看出,与 View1、View2 和 MAIDM 相比,MINDG 改进了所有数据集的指标。无论使用哪种单独视图,相应模型的预测能力都弱于基于两种视图协同的预测性能。这也表明多个视图具有互补作用,通过它们的协同作用,可以更充分地利用高阶图注意力网络和混合深度网络学习到的不同视图的深层特征,从而提高整体模型的性能。
最后,利用 MINDG 进行抗病毒药物再利用的探索。使用由清华大学 Gao Yan 等人解析的 SARS-CoV-2 3CL 蛋白酶序列输入模型,预测结合亲和力值排名前 10 的药物。
在 MINDG 生成的候选药列表中药物疗效的实际应用,有助于证明 MINDG 预测结果的信息价值。

不足和改进方向


MINDG 与一些最先进的方法进行了各种比较,结果表明所提出的方法性能更佳。
然而,MINDG 只是以顺序的方式学习药物和蛋白质的内在结构信息,并没有充分利用所有可用的内在结构信息。
未来,图学习方法可能会被用来学习药物和蛋白质的内在结构。此外,由于研究有限,研究人员还没有进行湿实验阶段。计划将来进行进一步的湿实验,包括药物 panel 测试。

编辑:文婧

MINDG结合了深度学习和图学习的优点,可以提取更深层次的结构特征,不仅依赖于一阶邻接节点的信息,还能利用高阶节点的关系,增强预测准确性。

传统方法往往只关注表面特征,而MINDG通过高阶图注意卷积网络,深入挖掘药物和靶点之间的复杂关系,提供了更全面的特征学习。

有点像拍照,多视角才能看到真实的样子!MINDG就像给一张照片加了多个镜头,能从不同角度捕捉到药物与靶点的互动。

除了深度学习,可能需要引入更多基于人工智能的算法,如强化学习,来进一步优化药物分子设计和筛选过程。

我觉得要加强跨学科的合作,让化学、计算机和生物等领域的知识结合,才能加速药物发现的进程。

搞科研就像打游戏,不仅要有好的武器(算法),还得有队友(跨学科合作)的支持,才能战斗力满满!

我觉得图学习在药物研究中潜力巨大,特别是对于处理复杂生物网络及其相互作用的建模,这是传统方法无法比拟的。

图学习能够有效处理顶点(药物、靶点)之间的关系,解析复杂的生物体系,给药物开发带来新的视角与方法。

简而言之,图学习就像是给药物开发划了一张地图,让科研人员能更精准地找到与目标靶点的关系,降低冤大头的可能性!