Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用( 六 )


2.5.4 图生成对抗性网络(GGAN)生成对抗性网络(GAN)也能够扩展到图域 。GAN背后的主要理念是对抗性训练 。生成器的目的是生成负类样本以欺骗鉴别器,而鉴别器的设计目的是识破负类样本,正确区分真实样本和生成的负类样本 。最终,这两种模式都将从这场零和博弈的联合训练中受益 。对数正则化图自动编码器采用对抗性训练原理对基于GCN的GAE进行正则化,以学习稳健的节点嵌入 。具有对抗性正则化自动编码器的网络表示(Netra)提出了一个用于学习网络表示的编解码器框架,而Netra的输入是以每个节点为根的随机游动,并且通过对抗性训练在先验分布内将学习到的嵌入正则化 。GraphGAN通过使用GAN增强了节点图嵌入的推理能力 。通过采用对抗性训练策略,对抗性网络嵌入通过将先验分布作为真实数据并将嵌入向量作为生成的负类样本来增强现有的图嵌入方法,其中GAN被用作附加的正则化项 。同时 , 一些研究也证明了对抗性训练也可以提高GNN的泛化能力 。为了解决分子图的生成问题,分子GAN结合了GCN、GAN和强化学习方案来生成具有所需性质的分子图 。NetGan将图生成任务视为学习有偏随机游走的分布,生成器使用LSTM网络产生可能的随机游动,鉴别器试图确定虚假的随机游动 。
此外,最近一些GNN模型的预训练和加速的研究也值得注意 , 例如 。GPT-GNN , Graph-BERT,RevGNN-Deep(具有大于1000层的最深GNN)和Graph-MLP,一种新的无需消息传递的图学习框架 。
2.5.5 开源为了方便研究人员实现和开发图表示学习算法,我们首先在表1中提供了图表示学习和图计算平台和库 。这些平台和库帮助研究人员快速对图表示学习算法进行基准测试并开发自己的模型 。我们还总结了图嵌入的实现和表2中回顾的GNN,其中大部分是官方实现 。

Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用

文章插图
表1:图计算和图表示学习的平台和库 。

Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用

文章插图

Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用

文章插图
表2:图表示学习算法的开源实现总结 。
3.在生物信息学中的应用从分子水平到医疗水平,图被广泛应用于表示和建模多通道的生物和医疗系统 。图4显示了不同尺度的生物医学图 。尽管一些开创性的工作已经将图表示学习技术应用于生物医学任务,如分子生成、药物再利用、相互作用预测,但图表示学习在生物医学任务中的应用还没有得到深入的探索 。在这一部分中 , 我们介绍了图表示学习在分子图分析、多组学图分析、医药保健图分析中的一系列代表性应用 。
Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用

文章插图
图4:不同尺度的生物医学图表概览 。从分子到医疗保健系统,图在生物医学领域无处不在,具有多种类型的类内和类间关系 。蛋白质和药物化合物的结构和功能可以看作是分子图 。蛋白质和非编码转录物(包括 miRNA、lncRNA、circRNA等)之间的综合关联对多组学图进行了建模 。药物、蛋白质靶点、ncRNA、微生物、疾病适应症及其相互作用构成了药物图 。并且电子病历、个性化组学和其他数据可以进一步集成到医疗保健系统级的知识图谱中 。这些相互关联的多模态图可以基于整体的视角进行系统的整合和充分理解 。
3.1 分子图的表示学习蛋白质和化合物等分子的结构可以看作是由原子和键组成的分子图 。节点是原子或氨基酸,边是化学键或肽键 。分子图的表示学习的目标是高效、自动地生成具有优化性质的新型分子 。
3.1.1 分子表示学习学习分子的高效表示在蛋白质功能预测、分子性质预测和药物发现等下游任务中起着基础性的作用 。除了基于字符串的表示,图表示学习还提供了更灵活、更好的分子表示,这些分子对于特殊任务来说是最佳的 。例如,Duvenaud等人提出了一个端到端的框架,通过使用GNN来学习可区分的分子指纹 。基于几何深度学习,Gainza等人提出了分子表面相互作用指纹图谱,在蛋白质参与相似相互作用可能共享共同指纹的假设下,捕捉针对特定生物分子相互作用而优化的指纹 。最近 , Li等人利用自适应GCN学习分子表示,同时考虑了三维分子结构的拓扑不变性和旋转不变性 。
3.1.2 分子性质预测分子性质的准确预测对化合物设计和药物开发至关重要 。Gilmer等人提出了一个统一的框架消息传递神经网络(MPNN),并在分子性质预测基准上展示了优越的性能 。为了保留分子的空间联系信息,Wang等人利用分子图数据引入了卷积空间图嵌入层(C-SGEL)来研究分子的性质 。多层C-SGEL被集成为卷积空间图嵌入模型,并融合分子指纹来预测分子性质 。Wieder等人对具有不同结构的GNN进行了一项关于预测分子性质的综述 。

推荐阅读