Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用( 七 )


3.1.3 分子图生成设计或生成具有所需性质的分子是药物发现和开发中的一个具有挑战性的问题 。现有的图生成模型的目标是直接对联合分布进行建模 。Jin等人提出了一种基于VAES的方法来生成连接树结构的化学子结构,然后使用图消息传递网络将它们组合成图 。Shih等生成分子图的自回归模型 。他们将图的生成描述为一个连续的决策过程 , 在每一步中生成一个新原子,然后确定生成的原子与现有原子之间的键 。Zang等人提出了一个基于可逆流的分子图生成模型,在分子图生成和重构、性质优化等方面取得了最好的性能 。最近,Mahmod等人提出了一个分子图生成模型,该模型使用简单的MPNN-GNN学习掩蔽图分量的条件分布,给定图的其余部分 。
3.2 多组学中的图表示学习

多组学(Multi-omics)研究是探究生物系统中多种物质之间相互作用的方法 。
多组学数据的综合分析已成为生命机制研究的新方向 。图表示学习是加速关系多组学数据分析的有价值的工具,包括基因组学、蛋白质组学和转录组学 。
3.2.1 基因组学图分析Li等人提出了一种基于LINE的单细胞表示学习方法,通过从基因表达数据和路径先验中考虑基因与基因的关联来学习对单细胞高通量RNA测序(scRNA-Seq)数据有意义的表示 。Li等人将各种基因组和表型图合并到一个异构多重图中,并开发了一种基于随机游走的疾病基因识别方法 。GCN-MF结合了GCN和矩阵因式分解来发现基因与疾病的关联 。通过使用基因表达矩阵的一个子集,Yang等人提出了一个统一的图变分生成对抗性网络模型(CONDGEN) , 该模型集成了GCN、VAE和GAN生成图的框架 。Rhee等人将基因表达数据组合成PPI图,并将其作为GCN的输入,定义了一个关系网络,以图卷积层加权的边为优先,表示关联的基因集 。
3.2.2 蛋白质组图分析蛋白质是生命活动的直接载体,蛋白质组学在阐明生命活动和复杂疾病的分子机制方面发挥着重要作用 。
You等人利用基于IsoMap的嵌入方法对PPI网络中的蛋白质节点进行编码 。他们在嵌入空间中测量蛋白质之间的相似性以预测PPI 。属性网络嵌入方法Graph2Go融合了蛋白质的属性特征和图嵌入,采用VGAE和GCN进行蛋白质功能推断和GO 。姚等人通过去除用于蛋白质复合体检测的可靠性低的PPI来堆叠GCN,以便构建更可靠的PPI网络 。
3.2.3 转录组图分析生物体的转录组含有大量的非编码RNA,包括miRNA、lncRNA、CircRNA等,它们在基因表达、细胞发育和各种生命活动中发挥着重要作用,与复杂的人类疾病密切相关 。
MMGCN开发了一种基于多视角、多通道注意力的GCN来预测miRNA与疾病的关联 。Sheng等人构建了一个三层异构图 , 以整合miRNA、lncRNA和疾病之间的相似性和关联性 。他们还提出了结合随机游走、卷积自动编码器和VAE的异构属性嵌入方法VADLP,利用注意力机制学习节点特征来预测lncRNA与疾病的关联 。Wang等人提出了一种基于FastGCN的方法GCNCDA , 通过合并疾病语义相似性信息和CircRNA的GIP来预测CircRNA与疾病的关联 。在我们以前的工作中,我们提出了一个分子关联网络,系统地集成了miRNA、lncRNA、CircRNA、mRNA、蛋白质、微生物、药物和疾病之间的全面关联,并提出了基于SDNE和node2vec的学习节点嵌入的方法 。融合节点嵌入和节点属性来预测分子间关系 , 如lncRNA-蛋白质相互作用和miRNA-疾病关联 。
3.3 药学中的图表示学习现代制药投资大、周期长、失败风险高 。图表示学习通过集成化合物化学信息、靶点相互作用和临床数据(如副作用和药物组合信息) , 可以加速药物发现和药物重新定位 。
3.3.1 药物-靶点相互作用(DTI)预测Zong等人应用药物-靶点-疾病三边图的Deepwalk来预测药物-靶点相互作用(DTI) 。赵等人融合了DTI和药物-蛋白质对之间的联系,并提出了一种基于GCN的方法来编码药物-蛋白质对的特征来推断DTI 。基于异构图表示学习,Peng等人提出了一种基于GCN的端到端学习方法来预测DTI 。他们考虑了药物、蛋白质、疾病和副作用之间的联系 。塔法尔等人使用node2vec学习药物和靶标的表示,并计算药物-药物、药物-靶标和靶标-靶标之间的相似性 。阮等人介绍了将药物编码为图的GraphDTA , 并应用GNN预测药物与靶标的结合亲和力 。药物-疾病关联预测能准确预测出药物合疾病之间的关联,可以发现现有药物的新适应症或推广新药治疗疾病,即所谓的药物重定位 。Zhang等人提出了一种基于相似性约束图因式分解的方法,利用已知的药物-疾病关联、药物特征和疾病语义信息来预测药物-疾病关联 。通过使用Deepwalk、LINE、SDNE和HOPE等图嵌入方法,郭等人将医学主题词表示为药物-疾病图 , 以学习药物和疾病的嵌入 。Yu等人构建了一个由已知的药物-疾病关联、药物-药物相似性和疾病-疾病相似性组成的异构图,并提出了分层注意力GCN来学习药物和疾病的嵌入,以预测药物-疾病关联 。

推荐阅读