当前位置:主页 > 医学论文 > 生物医学论文 >

基于知识的疾病关联分析与辅助机理解析

发布时间:2020-07-17 21:51
【摘要】:疾病关联网络是客观描述疾病关系的全局图谱,能够辅助药物重定位、推断病因、并发症分析、疾病机理推断等工作。近年来,虽然基于特定生物医学知识的疾病关联分析研究不断进步,但是从知识库选用单一疾病属性限制了疾病关联分析所处的观察角度。为获得全面客观的疾病关联网络,需要将不同视图的疾病关联网络整合为一个统一的网络。此外,疾病通路间的串扰同样反映了疾病之间的关联,但基于通路串扰模型的疾病关联研究尚未有报道。再有,疾病相关基因网络是疾病机理的系统模型,但在通路知识水平上解析其功能目前缺乏易用的工具。本文的研究分为两个部分。第一部分探究了现有疾病关联关系网络的多维度数据融合方法,提出了基于通路串扰的疾病关联网络的构建方法;第二部分基于网络指纹框架和通路知识库,构建了疾病基因网络通路解析工具,并用于疾病基因网络机理分析。为了探究现有疾病关联网络的多维度数据融合方法,首先将多个疾病网络的整合转化为多个相似性网络的融合问题,借鉴患者相似相网络融合方法,提出基于相似性网络融合方法SNF的一种解决方案;接着将现有的疾病关联网络经过数据预处理生成关于223种MeSH疾病的3个相似性网络,分别是在生物过程水平的疾病相似性网络B-HDN,在基因机理水平的疾病相似性网络M-HDN和症状表型水平的疾病相似性网络S-HDN,应用SNF网络融合方法构建了多视图融合的疾病相似性网络mvHDN;再基于mvHDN聚类得到22个疾病社团,发现其结构与融合前3个相似性矩阵中社团结构有差异。然后进行了疾病社团和边贡献度的联合分析:统计了7种边贡献度类型的社团内部边数量和占比,结果显示社团内部边在S-HDN贡献的边中占比对大;再统计了全部社团内部边中各类边贡献度类型数量和占比,B-HDN所贡献的边在社团内部边中占比最大。再将社团分类和MeSH疾病分类编码对比,发现mvHDN的疾病社团与疾病分类系统大体相似,但是2/3的疾病社团有不同MeSH编码出现;从各疾病类别的社团分布情况看:某些疾病类别独占了mvHDN疾病社团,另一些疾病类别广泛散布于多个疾病社团;最后讨论了mvHDN疾病社团暗示的一些新的疾病关联。为了建立基于通路串扰的疾病关联网络构建方法,首先提出了通路串扰模型的新的疾病关联定义,接着从KEGG中的通路数据库提取“Human Diseases”数据集,预处理得到67条重要疾病通路和102条生物学基本通路。然后搜索基本生物学通路的串扰边,发现约1/5的边属于串扰边;接着计算了关于边的4项拓扑学指标,发现基本生物学通路的串扰边与非串扰边相比拓扑学性质显著不同;之后分析了串扰边在通路中的分布情况,发现串扰边和串扰基因倾向于集中在少数最串扰通路中;然后用相似的计算过程分析了疾病通路的串扰,发现1/4以上的边属于串扰边,串扰边与非串扰的拓扑学属性差异显著,串扰边和串扰基因在少数最串扰通路中的集中分布趋势比基本生物学通路更明显;接下来分析了基本生物学通路和疾病通路的串扰边类型分布;最后统计通路类别间的串扰边讨论了疾病通路类别的串扰关联网络。为了给生物学家提供基于网络指纹的疾病基因网络通路解析工具,首先扩展了网络指纹框架,引入了网络比对算法,包含了4种网络比对打分算法;增加了参考网络数据库的来源,组成了766条参考通路、49个参考通路数据集;并且设计和开发了基于Java和R的可视化交互分析工具NFPscanner,实现了通过浏览器进行基因网络指纹解析的功能,提供了多个网络指纹的并列比较分析、网络比对分析功能;接着以疾病通路为实验数据,证明NFPscanner结果与标准工具KOBAS通路富集结果基本一致;接着并列比较分析了新生儿败血症相关基因网络和肥胖相关代谢基因网络的指纹,表明了两者在相关通路水平的差异点;最后开发了开源R包NFP,提供了适用生物信息学人员开展网络指纹分析的计算工具,调用函数可以计算查询网络的指纹和生成网络指纹的曲线图,并且以乳腺癌相关FOXM1通路网络为案例,演示了NFP的使用方法。本文的主要创新点在于:一是提出了基于多视角融合方法的多维度疾病关联网络融合的解决方案,对比研究了疾病关联网络与疾病分类系统的异同点;二是构建了基于通路知识库和网络串扰的疾病关联网络图,发现了疾病类别间串扰关系;三是发展了网络指纹框架,向其基本框架中加入网络比对算法,使发展成熟的网络比对算法获得新的应用场景;四是设计开发了基于网络指纹框架的疾病机理通路解析工具,可应用于疾病基因网络数据的在线解析。
【学位授予单位】:军事科学院
【学位级别】:博士
【学位授予年份】:2018
【分类号】:R318
【图文】:

社团,聚类有效性,疾病,相似性


邓恩指数的值域为[0, 1],值越大越好。社团个数变化时,邓恩指数和连通度会发生同时变化,mvHDN 社团聚类有效性评价实验结果如图2.2,横轴为预设的社团个数,纵轴为聚类有效性指标数值,红色曲线表示连通度,蓝色曲线表示邓恩指数。依据连通度尽可能小,邓恩指数尽可能大的联合标准,选择 22个疾病社团作为最优参数。将疾病的 MeSH 编码信息与疾病聚类社团汇总成为疾病社团表(附录 A)。感兴趣的是社团聚类结果与 MeSH 编码的差异程度,疾病所属聚类社团是唯一的,所以为了简化比较工作,假设疾病对应一个主要 MeSH 编码。当某个疾病有多个MeSH 编码存在时,制定的主要编码认定规则是:首先 223 种疾病数据集中出现所有 MeSH 编码进行计数,计算各个 MeSH 编码的总体频率

社团,内部边,贡献度,疾病


第 33 页图 2.4 疾病社团内部边的贡献度分析分类是基于综合疾病机理的相似性度量进行谱聚完全不借助已知的疾病分类知识库,包括DO, mvHDN 的疾病社团划分可以成为一项新的疾和讨论新的疾病分类模型代表的意义。选取的里面的疾病名称,因此理想情况下疾病社团的划大体上保持一致。将疾病的社团划分和 MeSH 有趣的未知疾病关联关系,为解释某些疾病的机病社团,纵轴表示 MeSH编码分类,颜色饱和

社团,疾病,对比分析,编码分类


期望发现有趣的未知疾病关联关系,为解释某些疾病的机理提供线索。图2.6中横轴表示疾病社团,纵轴表示 MeSH编码分类,颜色饱和度表示该分类组合的疾病个数。

【相似文献】

相关期刊论文 前10条

1 周智勇;;健康生活方式或能减轻心脏疾病基因风险[J];心血管病防治知识(科普版);2017年05期

2 袁芳;李靖;;基于功能相似性预测疾病基因[J];计算机应用研究;2012年11期

3 ;人类遗传性神经性高频性耳聋疾病基因(GJB3)的克隆[J];生物工程进展;2001年02期

4 王一斌;程咏梅;卫泽刚;张绍武;;基于熵聚类和双重筛选策略挖掘动脉粥样硬化风险疾病基因(英文)[J];生物物理学报;2014年01期

5 袁芳;周艳红;何光源;;利用相似显著性序列特征预测白血病疾病基因[J];华中师范大学学报(自然科学版);2012年04期

6 陈晓红,陈智;寻找疾病基因的策略进展[J];国外医学.流行病学传染病学分册;2004年01期

7 赵进英,方福德,蔡有余;克隆人类疾病基因的定位候选方法[J];基础医学与临床;1997年05期

8 ;我国独创疾病基因完整体系[J];海内与海外;2001年02期

9 赵静;林丽梅;;基于分子网络的疾病基因预测方法综述[J];电子科技大学学报;2017年05期

10 王宏;曲晓莉;赵研;张静;陈丽娜;;基于表达及网络拓扑结构挖掘动脉粥样硬化风险疾病基因[J];生物化学与生物物理进展;2010年08期

相关会议论文 前3条

1 孔令雯;葛正行;;综述COPD疾病基因多态性研究进展[A];2011年贵州省中西医结合学会呼吸专业学术会议论文汇编[C];2011年

2 ;疾病基因组中的拷贝数变异分析[A];2017中国长三角遗传学大会会议手册[C];2017年

3 夏诏杰;王忠;郭力;;构建中风疾病基因关系网络的方法研究[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年

相关重要报纸文章 前10条

1 许铁男;欧洲掀起探索疾病基因热潮[N];医药经济报;2001年

2 薛祖玲 王春;上海市自然科学牡丹奖揭晓[N];科技日报;2005年

3 李斌;成都学者研究疾病基因榜上有名[N];成都日报;2007年

4 Sharon Begley 编译 欧文;NIH投巨资找重要疾病基因[N];医药经济报;2016年

5 霍冬;现代疾病基因新疗法[N];中国高新技术产业导报;2000年

6 记者  尹宁静;易感疾病基因检测进入泰州[N];泰州日报;2006年

7 记者 李天舒;我国将开展五类重大疾病基因研究[N];健康报;2008年

8 王雪飞;RNA让疾病基因“沉默”[N];健康报;2006年

9 记者 郑晋鸣  通讯员 冷明祥;江苏院士领衔主攻疾病基因[N];光明日报;2002年

10 记者 叶玉跃;查清疾病基因家底[N];浙江日报;2011年

相关博士学位论文 前7条

1 邓岳;本体在疾病相关问题中的应用研究[D];西安电子科技大学;2016年

2 徐文剑;基于知识的疾病关联分析与辅助机理解析[D];军事科学院;2018年

3 石凯;基于网络模型的疾病相关模式挖掘方法研究[D];西安电子科技大学;2017年

4 赵志琴;分形和网络方法在蛋白质数据分析中的一些应用[D];湘潭大学;2015年

5 郭杏莉;基于网络模型的基因相关预测问题算法研究[D];西安电子科技大学;2013年

6 袁芳;基于基因功能信息预测疾病相关基因[D];华中科技大学;2008年

7 程健;计算方法识别必要基因的研究[D];西北农林科技大学;2014年

相关硕士学位论文 前10条

1 Malemia Mtisunge Tupochere;利用网络方法探索临床试验纳入标准数据中的疾病关系[D];北京交通大学;2018年

2 吴慧慧;基于生物网络的疾病基因的识别与分析[D];江南大学;2018年

3 虞佳;基于生物分子网络分析的疾病基因预测算法[D];西安电子科技大学;2014年

4 董梦南;基于分子网络的疾病基因预测算法[D];西安电子科技大学;2017年

5 陈颖;基于复杂网络的疾病基因预测的研究[D];东北大学;2009年

6 赵艳丽;基于时序网络的蛋白质复合物挖掘与疾病基因预测研究[D];华中师范大学;2015年

7 易阳;基于结构域信息的蛋白质复合物识别与疾病基因预测[D];华中师范大学;2016年

8 邵海珠;基于协同过滤的疾病基因预测方法[D];西安电子科技大学;2014年

9 王柯静;基于网络分析的肥胖和相关疾病的关系研究[D];河北科技大学;2017年

10 李论;基于氨基酸使用偏好及基因功能信息预测疾病相关基因[D];华中科技大学;2008年



本文编号:2759982

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/swyx/2759982.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f10ba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com