当前位置:主页 > 医学论文 > 内分泌论文 >

系统水平整合分子数据及表型数据重构罕见疾病分类体系

发布时间:2024-03-31 21:53
  随着生物医学数据采集技术的进步,组学科学产生了越来越多的生物医学数据,可获得的生物实体(如基因、表型、疾病等)关系数据不断积累。Orphanet是目前相对完善的基于疾病的临床症状和体征观察而建立的。然而,它没有考虑基因组学等组学数据对疾病关系的影响。以前的研究表明,疾病的遗传学知识可以决定疾病分类,并且是预测疾病之间关系的最重要的因素,同时,研究疾病关系正从基于共享基因等单个实体向系统的整合多个分子水平的数据转变。在此,本文针对罕见疾病异构信息网络数据,利用图正则化的非负矩阵三分解(GNMTF)模型,它将所有网络数据以矩阵形式表示,同时对罕见疾病,表型,基因进行共聚类,从而推断新的罕见疾病关系,从结果来看,通过整合基因相互作用组,罕见疾病-表型关系,罕见疾病-基因关系,我们的方法得到的罕见疾病关系对与Orphanet中直接相连疾病关系对重合率达到91%。然后我们运用边聚类算法探究新得到的罕见疾病拓扑网络中的疾病模块,并生成罕见疾病分类树状图。相比较于Orphanet,新得到的疾病模块中,疾病间分子层面相似度更高。此外,我们评估本文所包含的11种关系类型对预测模型性能影响,结果进一步强调...

【文章页数】:82 页

【学位级别】:硕士

【部分图文】:

图1-1在ORDO中查询raregeneticdisease类别得到的25个子类

图1-1在ORDO中查询raregeneticdisease类别得到的25个子类

1-1在ORDO中查询raregeneticdisease类别得到的25分类体系背景及意义类的地位就好比是自然科学领域里的标准度量衡可供医护人员使用,还可作为评价卫生服务系统随着人们对罕见疾病的认识水平的提高,罕见疾,需要科研人员不断修正完善。际疾病分类体系中几乎....


图1-2基于共享基因的罕见疾病网络[12]

图1-2基于共享基因的罕见疾病网络[12]

图1-2基于共享基因的罕见疾病网络[12]目前国内外大量的研究报告了从分子层面关联疾病的方法及好处。VanDrie等人提出了一种基于文献挖掘分析的方法,该方法针对OMIM可遗传疾病概要中的疾病表型描述文本进行建模,利用MeSH词表向量化疾病文本,得到每一疾病的特征向量....


图1-3疾病模块[8]

图1-3疾病模块[8]

图1-3疾病模块[8]识别疾病模块,也就是识别、抽取、分割疾病子网[25]。目前为止已经出现很多疾病模块的识别算法,这些方法主要是基于聚类算法来发现疾病网络中的高密度区域作为疾病模块。如MCODE(MolecularComplexDetection)方法先将每个节点的度设为....


图1-43种疾病网络局部图[13][15][29]

图1-43种疾病网络局部图[13][15][29]

database)的人类疾病之间的关联建立一个疾病网络,节点是疾病,边表示疾病间共享至少一个相关miRNA[31]。表型疾病网络(PhenotypicDiseaseNetwork,PDN)表型疾病网络是基于疾病间的共病现象而构建的。VanDriel等人利用文本挖掘....



本文编号:3944541

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/nfm/3944541.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户96ede***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com