网络医学中若干关联问题的计算分析
发布时间:2020-05-28 02:11
【摘要】:摘要:随着人类基因组计划和许多物种全基因组测序的完成,人类迎来了后基因组时代。在这一时代中,人们希望通过揭示基因及其产物蛋白质的功能,解决与人类健康和疾病相关的医学问题。 研究表明在生物体内,细胞单元之间通过相互作用而发挥功能,这些相互作用形成了一个极其复杂的交互网络。疾病的表现型是复杂交互网络中各种生理和病理学过程的体现。基于网络的研究方法可以加深对细胞交互网、致病基因和疾病通路等的理解。相应地,人们可以研制出更好的药物以便更有效地治疗疾病。研究人员将网络理论在人类疾病、医学及其相关领域的应用研究称为网络医学。网络医学不仅为系统探究分子水平上疾病的复杂性提供了支持平台,还可帮助人们发现致病基因和筛选药物靶点。 网络医学研究领域广泛。本论文期望采用计算分析的方法来对网络医学中三个亟待解决的关联问题进行研究,拓展对疾病的发病机理、病理过程和治疗方法等方面的了解。主要研究工作包括: (1)针对实验证实的(已标记的)药物-标靶关系较少、存在大量未知的(未标记的)药物-标靶关系,我们提出采用半监督学习算法来预测药物-标靶关系。我们从网络一致性的角度出发,融合多种生物特征,利用特征选择来预测药物-标靶相互作用关系,克服了有监督学习算法需要负样本辅助预测的不足。理论分析表明算法的时间复杂度得到了降低,交叉验证实验表明预测精度得到了提高。案例分析也得到了理想的预测结果。此外,我们还对未标记的关系进行了广泛的预测,部分预测结果在现有药物数据库中得到了证实。 (2)虽然越来越多的研究表明与微RNA有关的变异、调控失常等均会引发各种疾病,但针对微RNA和OMIM疾病关联关系的研究较少,OMIM数据库中大多数的疾病未有与其相关联的微RNA信息。我们提出采用随机游走算法来预测微RNA-OMIM疾病关联关系。我们首先构建了OMIM疾病相似性网络和微RNA-OMIM疾病关联关系网络,然后将随机游走算法应用于OMIM疾病相似性网络中对候选疾病打分排序进行预测。实验表明该算法具有一定的预测精度。我们预测并验证了部分排序在前的微RNA-OMIM疾病关联关系。 (3)随机游走算法用于微RNA-疾病关系预测时只用到了疾病相似性信息。为了进一步提高算法的预测精度,我们提出融合微RNA相似性信息、疾病相似性信息和微RNA-疾病二分图拓扑信息用于微RNA-疾病关系预测。我们充分研究了各相似性信息对算法预测精度的影响,实验结果表明融合多种相似性信息可以提高算法的预测精度。我们选择预测精度最好的算法NetCBI应用于微RNA-疾病关系预测。部分预测的排序在前的微RNA-疾病关联关系得到了相关数据库的证实。 (4)单核苷酸多态(SNPs)可阐明不同人群和个体在疾病的易感性和抵抗性方面存在差异的原因。SNPs位点间存在连锁不平衡关系,因此不需要对所有的SNPs位点进行检测,可以根据连锁不平衡关系测定一部分SNPs(即标签SNPs)的信息,通过标签SNPs表征的信息覆盖其余SNPs。我们对现有的基于连锁不平衡的单种群标签SNPs选择算法进行广泛的比较。同时提出了一个改进的求解该问题的贪婪算法MinTag。实验结果表明算法MinTag较之前的算法能找到更少的标签SNPs,具有更高的节约率。实验还表明预先对数据集划分为不相关的子区域可以大幅度降低程序的运行时间。 本文对网络医学中的上述三个关联问题进行研究,并提出了有效的求解算法。这些研究工作将会对生物学实验有指导意义。此外,本文提出的算法对其它类似的关联问题也具有普遍意义。
【图文】:
博士学位论文 1网络医学概况及本文工作介绍1870个节点,2240条边。网络中的节点表示蛋白质,边表示两个蛋白质之间存在相互作用。研究表明该网络是一个无尺度网络,少量度数高的节点(也称为hub节点)在网络中起着至关重要的作用。网络中的蛋白质易形成簇(duster),,最大簇里包含有大约78%的蛋白质节点。统计分析还表明网络中蛋白质的致死性(lethality)和连通性(connectivity)之间存在正相关的关系。基于全基因组关联分析(genome-wide association studies; GWAS)得到的复杂疾病致病基因数据,Barrenas等人[15]构建了复杂疾病网络和复杂疾病致病基因网络(图1-3),并研究了复杂疾病共有的基因结构。研究表明属于同类的复杂疾病其致病基因并不总是相同,复杂疾病致病基因网络还表现出高度的模块化特点。Hidalgo等人[16]利用超过3千万条的医学记录数据构建了疾病表现型网络,该网络包括1万多种疾病。文献[16]还研究了疾病网络中疾病间同时发病的关联关系,网络中疾病-疾病关联关系和疾病网络的动态性等。
(genome-wide association studies; GWAS)得到的复杂疾病致病基因数据,Barrenas等人[15]构建了复杂疾病网络和复杂疾病致病基因网络(图1-3),并研究了复杂疾病共有的基因结构。研究表明属于同类的复杂疾病其致病基因并不总是相同,复杂疾病致病基因网络还表现出高度的模块化特点。Hidalgo等人[16]利用超过3千万条的医学记录数据构建了疾病表现型网络,该网络包括1万多种疾病。文献[16]还研究了疾病网络中疾病间同时发病的关联关系,网络中疾病-疾病关联关系和疾病网络的动态性等。r , r,I. *m'i ‘‘‘、‘ X \,/■ A. ! ->? L \ ?■?' dii V图1-2酵母蛋白质交互网络[〗4】Figure 1-2 Yeast protein interaction network4
【学位授予单位】:中南大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:R36;TP393.09
本文编号:2684531
【图文】:
博士学位论文 1网络医学概况及本文工作介绍1870个节点,2240条边。网络中的节点表示蛋白质,边表示两个蛋白质之间存在相互作用。研究表明该网络是一个无尺度网络,少量度数高的节点(也称为hub节点)在网络中起着至关重要的作用。网络中的蛋白质易形成簇(duster),,最大簇里包含有大约78%的蛋白质节点。统计分析还表明网络中蛋白质的致死性(lethality)和连通性(connectivity)之间存在正相关的关系。基于全基因组关联分析(genome-wide association studies; GWAS)得到的复杂疾病致病基因数据,Barrenas等人[15]构建了复杂疾病网络和复杂疾病致病基因网络(图1-3),并研究了复杂疾病共有的基因结构。研究表明属于同类的复杂疾病其致病基因并不总是相同,复杂疾病致病基因网络还表现出高度的模块化特点。Hidalgo等人[16]利用超过3千万条的医学记录数据构建了疾病表现型网络,该网络包括1万多种疾病。文献[16]还研究了疾病网络中疾病间同时发病的关联关系,网络中疾病-疾病关联关系和疾病网络的动态性等。
(genome-wide association studies; GWAS)得到的复杂疾病致病基因数据,Barrenas等人[15]构建了复杂疾病网络和复杂疾病致病基因网络(图1-3),并研究了复杂疾病共有的基因结构。研究表明属于同类的复杂疾病其致病基因并不总是相同,复杂疾病致病基因网络还表现出高度的模块化特点。Hidalgo等人[16]利用超过3千万条的医学记录数据构建了疾病表现型网络,该网络包括1万多种疾病。文献[16]还研究了疾病网络中疾病间同时发病的关联关系,网络中疾病-疾病关联关系和疾病网络的动态性等。r , r,I. *m'i ‘‘‘、‘ X \,/■ A. ! ->? L \ ?■?' dii V图1-2酵母蛋白质交互网络[〗4】Figure 1-2 Yeast protein interaction network4
【学位授予单位】:中南大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:R36;TP393.09
【参考文献】
相关期刊论文 前4条
1 顾坚磊;周雁;;中国基因组生物信息学回顾与展望[J];中国科学(C辑:生命科学);2008年10期
2 刘伟;谢红卫;;基于生物信息学方法发现潜在药物靶标[J];生物化学与生物物理进展;2011年01期
3 李金花;谢海龙;;MicroRNA与肿瘤[J];国际病理科学与临床杂志;2007年01期
4 张怡,张奎星,王谷亮,黄薇,朱鼎良;血管紧张素112型受体基因多态性与原发性高血压(英文)[J];Acta Pharmacologica Sinica;2003年11期
相关博士学位论文 前1条
1 汪小我;microRNA相关问题的计算分析[D];清华大学;2008年
本文编号:2684531
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/2684531.html
最近更新
教材专著