当前位置:主页 > 理工论文 > 生物学论文 >

基于拓扑及语义相似性的生物网络疾病模块挖掘算法研究

发布时间:2020-07-23 12:36
【摘要】:识别生物网络中的疾病模块已经引起很大关注,因为准确的预测疾病模块有助于理解复杂疾病的发病机理并促进疾病诊断和治疗。当前,研究人类蛋白质之间的相互作用关系逐渐成为揭示复杂疾病背后作用机理最为有效的方法之一,但现有的蛋白质相互作用关系仍存在着大量缺失以及错误。于是许多疾病模块挖掘算法都尝试使用其他一些生物学或拓扑学数据来调整蛋白质网络以进行疾病模块挖掘,但这些方法都没有同时考虑到蛋白质网络中相互作用缺失和错误的问题。因此,本文通过有效的结合多种生物数据资源,从而可以更加准确的识别疾病模块。本文的主要研究工作如下:(1)本章提出了基于拓扑和语义相似性在蛋白质网络上挖掘疾病模块算法(IDMCSS)。首先,利用候选蛋白质与疾病蛋白质之间的拓扑相似性和语义相似性增加和删除一些可能缺失和错误的蛋白质相互作用关系,对现有蛋白质网络结构进行调整。然后,在调整过后的蛋白质网络上扩充拓扑相似性和语义相似性之和最大的候选蛋白质,直到扩充的候选蛋白质集合不再显著富集生物信息为止。蛋白质网络调整策略贯穿整个算法,每次扩充候选疾病蛋白质之前都要利用候选蛋白质与疾病蛋白质之间的拓扑相似性和语义相似性对网络局部结构进行调整,使得本文提出算法在存在大量假阳性和假阴性数据的蛋白质网络上能够搜索到理想的疾病模块。在实验部分,将本文提出的IDMCSS与其他多种算法在哮喘疾病数据集上进行了比较和分析,在哮喘数据集上的实验结果证明了IDMCSS算法的有效性。(2)本章提出了基于拓扑、语义以及表型相似性在双层网络上挖掘疾病模块算法(IDMCSPS)。本文在工作IDMCSS的基础上,利用构建的蛋白质-表型网络代替蛋白质相互作用网络,有效的使用蛋白质相互作用、表型相似性以及蛋白质表型关联数据挖掘疾病模块。首先,构建蛋白质-表型双层网络。然后,利用协同过滤方法增加蛋白质-表型关系,同时利用拓扑相似性和语义相似性对现有蛋白质网络结构进行调整。最后,在调整过后的双层网络上计算候选蛋白质与疾病蛋白质之间的拓扑相似性和语义相似性以及候选蛋白质与所研究疾病相似的疾病之间的表型相似性,扩充拓扑、语义以及表型相似性之和最大的候选蛋白质,直到扩充的候选蛋白质集合不再显著富集生物信息为止。双层网络调整策略贯穿整个算法,每次扩充候选疾病蛋白质之前对双层网络进行调整。在实验部分,将算法IDMCSPS与多种疾病模块挖掘算法在哮喘疾病数据集上进行了比较和分析。实验结果表明IDMCSPS算法挖掘得到的疾病模块中显著富集哮喘生物信息,并且与IDMCSS算法挖掘的疾病模块相比,有更多离散的已知疾病蛋白质被扩充到疾病模块当中,因为现有蛋白质网络中存在大量相互作用关系的错误和缺失,导致一些疾病蛋白质的拓扑相似性比较低,而随着表型相似性数据的融入,提高了这部分疾病蛋白质的排名。
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q811.4
【图文】:

表型,蛋白质


逦第二章疾病模块挖掘相关理论和算法评价机制逡逑如下图2.2所示,表型Pl对应两个已知疾病蛋白质gjng2,蛋白质§1与表型逡逑pdnp2相关。所以一种表型可能对应一个或多个疾病蛋白质,同时一个疾病蛋白逡逑质也可能与一个或多个表型相关联,即表型和疾病蛋白质是一种多对多的关系。逡逑图2.2:蛋白质-表型关系逡逑Fig.邋2.2:邋Protein-phenotype邋relationship逡逑2.1.3表型相似性网络逡逑到目前为止还没有生物信息数据库对表型之间的关系进行比较完善和系统逡逑的整理,现在很多研宄工作中使用的疾病表型相似性数据都是从一些相对比较可逡逑靠的文献中整理得到的。特别地,Van邋Driel等人[24]对表型相似性网络的整理做逡逑出了重大贡献,他们使用OMIM数据库对各种表型的描述信息整理出了多达逡逑5000多种表型之间的关联信息,并且根据这些信息构建出了表型相似性网络。逡逑Pi逦Ps逡逑图2.3:表型相似性网络逡逑Fig.邋2.3:邋Phenot

表型,相似性


逦第二章疾病模块挖掘相关理论和算法评价机制逡逑如下图2.2所示,表型Pl对应两个已知疾病蛋白质gjng2,蛋白质§1与表型逡逑pdnp2相关。所以一种表型可能对应一个或多个疾病蛋白质,同时一个疾病蛋白逡逑质也可能与一个或多个表型相关联,即表型和疾病蛋白质是一种多对多的关系。逡逑图2.2:蛋白质-表型关系逡逑Fig.邋2.2:邋Protein-phenotype邋relationship逡逑2.1.3表型相似性网络逡逑到目前为止还没有生物信息数据库对表型之间的关系进行比较完善和系统逡逑的整理,现在很多研宄工作中使用的疾病表型相似性数据都是从一些相对比较可逡逑靠的文献中整理得到的。特别地,Van邋Driel等人[24]对表型相似性网络的整理做逡逑出了重大贡献,他们使用OMIM数据库对各种表型的描述信息整理出了多达逡逑5000多种表型之间的关联信息,并且根据这些信息构建出了表型相似性网络。逡逑Pi逦Ps逡逑图2.3:表型相似性网络逡逑Fig.邋2.3:邋Phenot

计算示例,种子蛋白质,蛋白质


Fig.邋2.5:邋Example邋of邋connectivity邋significance邋calculation逡逑2.1.DIAMOnD算法流程逡逑:蛋白质网络PPI,种子蛋白质s。逡逑:疾病模块逡逑过公式(2.15)计算与任意一个种子蛋白质有边连接的候选蛋白质的逡逑接显著性《值;逡逑据连接显著性P-W7/M值对所有的候选蛋白质进行排序;逡逑连接显著性最大的候选蛋白质加入种子蛋白质集合当中,种子蛋白质逡逑数量从->邋%邋=逦+邋1;逡逑复步骤1-3,每次将连接显著性最大的候选蛋白质加入种子蛋白质集合逡逑且扩充到疾病模块中行步骤1-4,直到模块跨越整个网络。候选蛋白质被加入模块的顺序反在拓扑结构上与疾病的关联程度。逡逑

【相似文献】

相关期刊论文 前10条

1 周智勇;;健康生活方式或能减轻心脏疾病基因风险[J];心血管病防治知识(科普版);2017年05期

2 袁芳;李靖;;基于功能相似性预测疾病基因[J];计算机应用研究;2012年11期

3 ;人类遗传性神经性高频性耳聋疾病基因(GJB3)的克隆[J];生物工程进展;2001年02期

4 王一斌;程咏梅;卫泽刚;张绍武;;基于熵聚类和双重筛选策略挖掘动脉粥样硬化风险疾病基因(英文)[J];生物物理学报;2014年01期

5 袁芳;周艳红;何光源;;利用相似显著性序列特征预测白血病疾病基因[J];华中师范大学学报(自然科学版);2012年04期

6 陈晓红,陈智;寻找疾病基因的策略进展[J];国外医学.流行病学传染病学分册;2004年01期

7 赵进英,方福德,蔡有余;克隆人类疾病基因的定位候选方法[J];基础医学与临床;1997年05期

8 ;我国独创疾病基因完整体系[J];海内与海外;2001年02期

9 赵静;林丽梅;;基于分子网络的疾病基因预测方法综述[J];电子科技大学学报;2017年05期

10 王宏;曲晓莉;赵研;张静;陈丽娜;;基于表达及网络拓扑结构挖掘动脉粥样硬化风险疾病基因[J];生物化学与生物物理进展;2010年08期

相关会议论文 前3条

1 孔令雯;葛正行;;综述COPD疾病基因多态性研究进展[A];2011年贵州省中西医结合学会呼吸专业学术会议论文汇编[C];2011年

2 ;疾病基因组中的拷贝数变异分析[A];2017中国长三角遗传学大会会议手册[C];2017年

3 夏诏杰;王忠;郭力;;构建中风疾病基因关系网络的方法研究[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年

相关重要报纸文章 前10条

1 记者 俞慧友 通讯员 杨秀菊;两潜在治疗精神疾病基因靶点找到[N];科技日报;2018年

2 许铁男;欧洲掀起探索疾病基因热潮[N];医药经济报;2001年

3 薛祖玲 王春;上海市自然科学牡丹奖揭晓[N];科技日报;2005年

4 李斌;成都学者研究疾病基因榜上有名[N];成都日报;2007年

5 Sharon Begley 编译 欧文;NIH投巨资找重要疾病基因[N];医药经济报;2016年

6 霍冬;现代疾病基因新疗法[N];中国高新技术产业导报;2000年

7 记者  尹宁静;易感疾病基因检测进入泰州[N];泰州日报;2006年

8 记者 李天舒;我国将开展五类重大疾病基因研究[N];健康报;2008年

9 王雪飞;RNA让疾病基因“沉默”[N];健康报;2006年

10 记者 郑晋鸣  通讯员 冷明祥;江苏院士领衔主攻疾病基因[N];光明日报;2002年

相关博士学位论文 前7条

1 石凯;基于网络模型的疾病相关模式挖掘方法研究[D];西安电子科技大学;2017年

2 邓岳;本体在疾病相关问题中的应用研究[D];西安电子科技大学;2016年

3 徐文剑;基于知识的疾病关联分析与辅助机理解析[D];军事科学院;2018年

4 赵志琴;分形和网络方法在蛋白质数据分析中的一些应用[D];湘潭大学;2015年

5 郭杏莉;基于网络模型的基因相关预测问题算法研究[D];西安电子科技大学;2013年

6 袁芳;基于基因功能信息预测疾病相关基因[D];华中科技大学;2008年

7 程健;计算方法识别必要基因的研究[D];西北农林科技大学;2014年

相关硕士学位论文 前10条

1 祝火乐;基于拓扑及语义相似性的生物网络疾病模块挖掘算法研究[D];安徽大学;2019年

2 孙连杰;使用四种模式生物研究miRNA对人类疾病基因的调控作用[D];南京师范大学;2018年

3 吴慧慧;基于生物网络的疾病基因的识别与分析[D];江南大学;2018年

4 崔振东;识别疾病相关miRNA和gene的方法研究[D];温州大学;2018年

5 熊能;基于异质网络排序候选疾病基因的算法研究[D];湖南大学;2015年

6 刘斌;基于拓扑相似性与语义相似性的疾病基因预测研究[D];湖南大学;2015年

7 王莹;基于组织特异网络模型的疾病基因排序方法[D];西安电子科技大学;2018年

8 Malemia Mtisunge Tupochere;利用网络方法探索临床试验纳入标准数据中的疾病关系[D];北京交通大学;2018年

9 虞佳;基于生物分子网络分析的疾病基因预测算法[D];西安电子科技大学;2014年

10 董梦南;基于分子网络的疾病基因预测算法[D];西安电子科技大学;2017年



本文编号:2767325

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2767325.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e042f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com