面向疾病表型分子机理预测的网络分析方法研究

发布时间:2024-03-02 17:47
  疾病表型与基因型关联是现代生物医学研究的核心内容之一。识别疾病表型的致病基因,研究这些基因在疾病发生发展过程中的作用机制是生物医学基础研究的主要目标。传统的致病基因识别方法(如连锁映射和全基因组关联分析)主要从实验角度出发,但是整个生物实验和数据分析的过程极为耗时耗力。随着人类全基因组计划的完成和高通量测序技术的成熟,目前已经积累了海量的生物实验数据。基于表型和基因型相关的数据,采用计算方法预测致病基因被证明是一种有效的方法。近年来相关研究者陆续提出了多种性能显著的疾病表型基因预测方法,但鉴于疾病分子机制的复杂性,仍然存在诸多问题与挑战:(1)基于网络传播的预测模型易受到网络中核心节点的影响,导致模型偏向于识别出网络中的核心基因;(2)对于基于嵌入表示的预测方法,充分利用已有的多种异构关系来构建疾病和基因的上下文信息仍是一个难题,同时探索不同的异构网络对预测性能的影响也至关重要;(3)目前大多数的预测方法会受到相互作用组学数据的不完整性和表型基因型关联的研究偏向性的影响,导致很难识别出新颖且可靠的候选基因;(4)由于医学关系数据的稀疏性和复杂性,设计基于多视图特征的深度神经网络模型预测...

【文章页数】:117 页

【学位级别】:博士

【部分图文】:

图2-1网络传播方法的示例图

图2-1网络传播方法的示例图

阵);基于多种基因相关的信息,构建了9个基因关系网络(=()×表示基因网络的权重矩阵);基于已有的疾病-基因关系,构建了疾病-基因关系网络(=()×表示疾病基因网络的权重矩阵)。然后对四个权重矩阵分别做归一化操作,可以得到它们的归一化矩阵,即=()×=(/∑=1)×(若∑=1=0....


图2-2疾病和基因相关的关系数目概览Figure2-2Summaryofthenumberofdiseaseandgenerelatedassociations.

图2-2疾病和基因相关的关系数目概览Figure2-2Summaryofthenumberofdiseaseandgenerelatedassociations.

北京交通大学博士学位论文18MalaCards和DisGeNet库中的疾病术语编码不一致,因此我们将这两个库中的疾病术语编码统一对应到UMLS[114]库的术语编码(即CUI)。从DisGeNet和MalaCards中分别获得的疾病-基因关系仅仅存在5.47%的重叠关系,这样能够....


图3-1D)和融合网络表示与网络传播的预测算法RW-RDGN(图3-1E)

图3-1D)和融合网络表示与网络传播的预测算法RW-RDGN(图3-1E)

北京交通大学博士学位论文22LVRSim(图3-1D)和融合网络表示与网络传播的预测算法RW-RDGN(图3-1E)。最后,我们使用十重交叉验证方法对比了不同算法的预测性能,结果表明RW-RDGN方法的预测性能显著优于基线方法。同时,案例分析结果也表明RW-RDGN方法预测到的候....


图3-2基于不同疾病相似度的疾病重叠分布

图3-2基于不同疾病相似度的疾病重叠分布

北京交通大学博士学位论文30算法的整体性能表现较差(AP<0.3;在TOP@3上,PR<0.4,RE<0.4,F1<0.25),而LVRSim_N算法的性能远远好于LVRSim_L(AP>0.5;在TOP@3上,PR>0.6,RE>0.7,F1>0.5)。这表明对于疾病基因预测任....



本文编号:3917175

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3917175.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户97450***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com