Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用

4.(2021.6.24)Briefings-生物信息学中的图表示学习:趋势、方法和应用论文标题: Graph representation learning in bioinformatics: trends, methods and applications论文期刊: Briefings in Bioinformatics 2021论文地址: https://www.researchgate.net/profile/Haicheng-Yi/publication/354327323_Graph_representation_learning_in_bioinformatics_trends_methods_and_applications/links/625c158c709c5c2adb836141/Graph-representation-learning-in-bioinformatics-trends-methods-and-applications.pdf

  • 4.(2021.6.24)Briefings-生物信息学中的图表示学习:趋势、方法和应用
    • 摘要
    • 1.引言
    • 2.图表示学习概述
      • 2.1 基本定义
        • 2.1.1 定义1:同构图和异构图
        • 2.1.2 定义2:属性图
        • 2.1.3 定义3:元路径
        • 2.1.4 定义4:一阶邻近度
        • 2.1.5 定义5:高阶邻近度
        • 2.1.6 定义6:语义邻近
      • 2.2 同构图嵌入
        • 2.2.1 基于矩阵分解的方法
        • 2.2.2 基于随机游走的方法
        • 2.2.3 基于传统深度学习的方法
      • 2.3 异构图嵌入
        • 2.3.1 基于元路径的方法
        • 2.3.2 基于分解的方法
        • 2.3.3 基于传统深度学习的方法
      • 2.4 属性图嵌入
      • 2.5 图神经网络(GNN)
        • 2.5.1 图递归神经网络(GRN)
        • 2.5.2 图卷积神经网络(GCN)
        • 2.5.3 图自动编码器(GAE)
        • 2.5.4 图生成对抗性网络(GGAN)
        • 2.5.5 开源
    • 3.在生物信息学中的应用
      • 3.1 分子图的表示学习
        • 3.1.1 分子表示学习
        • 3.1.2 分子性质预测
        • 3.1.3 分子图生成
      • 3.2 多组学中的图表示学习
        • 3.2.1 基因组学图分析
        • 3.2.2 蛋白质组图分析
        • 3.2.3 转录组图分析
      • 3.3 药学中的图表示学习
        • 3.3.1 药物-靶点相互作用(DTI)预测
        • 3.3.2 药物-药物相互作用(DDI)预测
      • 3.4 医疗保健中的图表示学习
    • 4.挑战和机遇
      • 4.1 数据质量
      • 4.2 复杂的图结构
      • 4.3 可解释性和鲁棒性
    • 结论
摘要图是描述复杂系统的一种天然数据结构,它包含一系列对象和关系 。无处不在的现实生活中的生物医学问题可以建模为图分析任务 。机器学习,特别是深度学习,在大量的生物信息学场景中取得成功 , 数据以欧氏空间表示 。然而,非欧几里德生物医学图中保留了丰富的生物元素之间的关系信息,这对经典的机器学习方法来说并不友好 。图表示学习的目的是将图嵌入到低维空间中,同时保持图的拓扑和节点属性 。它连接了生物医学图和现代机器学习方法,最近引起了机器学习和生物信息学领域的广泛关注 。本文综述了图表示学习及其在生物信息学中的代表性应用 。为了提供全面和结构化的分析和视角,我们首先对图嵌入方法(同构图嵌入、异构图嵌入、属性图嵌入)和图神经网络进行了分类和分析 。从分子水平到基因学、制药和医疗保健系统水平,总结了它们的代表性应用 。此外,我们为实现这些图表示学习方法总结了相关方法的开源平台和库 , 并讨论了生物信息学中图表示学习的挑战和机遇 。这项工作对新兴的图表示学习算法及其在生物信息学中的应用做了一个全面的调查 。预计它将为研究人员提供有价值的见解,以协助他们为图表示学习和面向未来的生物信息学研究做出贡献 。
1.引言图是一种自然的数据结构,它包含一组对象和对象之间的两两关系的集合,是描述和建模现实生活中普遍存在的复杂系统的通用语言,如社交网络、学术引文网络和词语同现网络(不同单词出现在同一句子中) 。从分子结构到医疗保健系统,生物医学图在生物医学和生命科学领域无处不在,例如,基因调控网络、蛋白质相互作用(PPI)网络、人脑连接体和生物医学知识图谱 。图正日益成为生物医学系统建模、学习和推理的主要工具 。
分子生物学、生理学和组学(例如基因组学、蛋白质组学等)的快速发展促进了人们对生物分子、细胞、器官如何协同进行重要的生化或生理活动的理解 。将生物组件表示为节点 , 将节点之间的相互作用表示为边 , 可以自然地将复杂的生物系统建模为图 。这一简洁的概念正逐渐被研究人员接受和推广 。为解决生物问题而建模和分析生物图的趋势可以分为三个阶段:双边生物图、多关系生物图和多模态生物医学知识图 。我们对它们作如下简要介绍:
  1. 双边生物图 。它包含两种生物对象以及它们之间的联系 。它已经应用于许多重要的生物学任务,例如基于PPI图的蛋白质功能注释,从DTI图推断药物的新适应症,"miRNA-疾病"关联预测,"lncRNA-疾病"关联预测和"CircRNA-疾病"关联检测;

    推荐阅读