基于Biclustering的跨病种症状群分析研究
发布时间:2020-08-02 12:55
【摘要】:症状是疾病诊断与治疗的重要表征,症状在疾病以及患者表现中具有特定的规律,以往的相关研究一般重点关注症状与疾病的关系,以发现疾病特异性的症状为主要研究目标。但十余年来,医学研究人员发现某些症状往往在不同疾病和患者中同时出现,形成具有显著同现规律的症状群(Symptom Cluster)。鉴于症状管理的重要性,症状群的确认及其分子机理的发现已经成为医学研究的热点问题。传统的症状群分析方法以主成分和隐类模型等为主,并且目前研究人员主要关注于某种特定的疾病下症状群的规律。但在跨病种的症状群分析中往往还需要确认关联的疾病信息,因此,存在显著不足。本文采用Biclustering的方法进行跨病种的症状群分析,利用一个具有较全疾病谱的疾病症状关系数据行研究,确认特定的症状群结构及分子机理。本文主要研究工作包括以下两个方面:为了研究跨病种症状群规律,首先我们利用来自疾病本体论,人类表型本体论,OrphaNet,MalaCards和统一医学语言系统库中搜集并集成共计16,383种高质量疾病-症状关系数据。该数据包含如糖尿病,艾滋病毒,肺疾病,心脏疾病,黄热病,失调,慢性肝炎,发炎等常见疾病.此外,还包含如疼痛,疲劳,恶心,麻木,咳嗽,呕吐,食欲不振,虚弱,痛苦等症状.数据集共计包含13,532疾病和2,378症状,基于此数据集我们采用了三种经典的Biclustering算法:BIMAX(Binary inclusion-maximal),QUBIC(Qualitative Biclustering)和Spectral Clustering进行症状群的聚类分析,发现并确认了多种具有临床意义的症状群。这些症状群在不同的病种中同时出现,反映了不同疾病的共性临床表型模式和规律。例如,如下三个症状群:疼痛、抑郁和疲劳;恶心和呕吐;疼痛、疲劳、睡眠障碍、嗜睡、食欲不振,他们在真实临床中也是常见的伴随症状群,确实与现实临床经验吻合.基于此结果,我们结合371,422种症状-基因关系,共计有2834种症状和16728种基因数据,并利用841,068条相互作用组网络数据(来自大规模整合数据库STRING 11)。并采用共享基因、最短路径和GO分析等分析方法进行分析,与此同时,我们通过随机取样与实验结果相同的症状群样本作为症状群的实验对照组。实验分析对比结果表明,通过Biclustering相关算法实验得到的这些症状群具有较高的共享基因可能性、较短的蛋白质相互作用分子路径等共享的分子机制(与随机症状组合相比,p值0.05)。进一步的比较分析表明,在以上三种方法中,我们发现QUBIC方法获得了具有较好生物学意义的聚类结果,而谱聚类则在共享分子机制方面获得了最好的症状聚类结果。此外,基于Biclustering算法取得的症状群在GO、pathway方面每个注释簇的富集得分具有统计学意义在后续研究中,我们将进一步探索不同聚类方法对跨病种症状群分析的性能优劣。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R-05;TP301.6
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R-05;TP301.6
【相似文献】
相关期刊论文 前10条
1 翟莹莹;杨Y
本文编号:2778540
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2778540.html