基于多阶信息的复杂疾病分子网络研究

发布时间:2020-08-12 21:40
【摘要】:随着生物信息的发展和多层次高通量组学数据的出现,生命科学研究进入了大数据时代,同时也面临着新的革命。生物分子层面的研究模式从单个分子扩展到多个分子以及它们之间的相互作用。计算系统生物学为挖掘生物大数据提供了数学理论基础与方法储备。尤其,网络作为刻画大数据关系的有力工具,逐渐被应用于分析各种高通量生物数据。其中,复杂疾病作为威害人类健康的主要杀手,其致病机理、早期诊断和后期治疗成为生物医学最关注的研究领域。如何从分子网络角度结合高通量生物组学数据来研究复杂疾病的发病机制及致病基因是目前亟待解决的问题。本文主要利用复杂网络本身的数学特性,结合生物高通量组学数据,建立了针对复杂疾病的新型分子网络模型,并对疾病的致病机理、早期诊断及富集的生物通路进行了深入研究。现有的大多数疾病分子网络模型,无法真实地反映现实网络的随机波动和噪音。对此,我们提出利用生物组学数据的多阶统计信息来构建分子网络模型,并提出具体的分析算法。其次,我们针对临床样本数据少这一现实,利用多阶统计信息构建了单样本分子网络:差异网络模型,并利用该模型对生物通路富集问题进行了深入研究。本文的主要研究成果有:1.利用生物组学数据(主要是基因表达数据)的一阶、二阶统计信息,建立了新型的多阶信息分子网络。利用数据的多阶信息,尽可能地还原生物分子网络的真实发展过程。通过对多阶信息分子网络理论与应用的研究,我们发现,结合了二阶统计信息的生物分子网络(边网络)能更好地缩小对致病基因的搜索范畴,从而能更精确地找到与疾病相关的致病基因。通过对H3N2流感病毒感染后的时序基因表达数据的分析,我们发现,通过边网络模型找到的疾病基因不仅能有效预测病毒感染的发生与否,还能尽可能早地给出预测结果。也就是说这些基因在对H3N2流感感染的早期预测上具有高效的生物标记功能。2.从单样本数据出发,利用多阶统计信息构建了单样本分子网络。不同于基础理论研究,临床诊断中的实际样本数量是极其有限的,单样本分子网络将为复杂疾病分子网络模型的实际应用创造条件。通过设计合理的可加性量化指标,我们发现,整合了基因表达值与基因表达相关性值而构建的差异表达网络能更全面地提取正常与疾病生物分子网络之间的差异信息,从而提高疾病预测的精度及鲁棒性。在对前列腺癌及糖尿病的疾病数据分析中,我们取得了较丰富的工作成果:全面评估了各种差异信息对疾病预测的贡献;挖掘了具有显著生物意义的差异模块;识别了与疾病异质性相关的生物功能模块,例如可变剪切;筛选了高精度且具有鲁棒性的生物标记模块。3.为了进一步比较多阶信息分子网络与传统的一阶信息网络,基于差异表达网络开发了集成生物通路富集分析模型及算法。传统的生物通路富集分析仅仅考虑了点网络中一阶信息上的差异,而集成生物通路富集分析将同时考虑二阶信息上的差异。这为解释复杂疾病分子网络的生物意义提供了新的视角。通过设计针对双重差异的超几何检验指标,我们发现,整合了表达均值差异与表达方差差异的集成生物通路富集分析算法,在异质性样本中的富集分析能力显著提高。在模型评估中,我们在大量疾病数据上对现有的多种生物通路富集分析方法进行了比较,其结果体现了集成生物通路富集分析算法的优势和扩展性。在对典型的异质性疾病-糖尿病的研究中,集成生物通路富集分析有效地识别出了异常调控的生物通路及这些通路标记下的潜在糖尿病亚型。综上,我们对复杂疾病分子网络的研究,为理解疾病的致病机理和疾病的早期预测做出了一定的贡献。多阶信息分子网络(边网络)将更全面地包含生物组学数据中的信息,从而可以为疾病研究定位更少更精确的致病候选基因,同时也为疾病预测提供了更精细的分析手段。单样本分子网络(差异网络模型)则克服了实际应用中样本数据少的问题,为实现个体化医疗提供了理论与技术基础。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:Q811.4;R3416
【图文】:

物理模块,网络模型


过贝叶斯模型来描述共表达基因模块与它们共享的调控上游因子;另一方面是通过逡逑物理相互作用图来描述在研究条件下所可能发生的蛋白相互作用及蛋白-DNA相互逡逑作用。一个详细的实例如图1.1所示,调控因子Mobl及其37个目标基因在2个细逡逑胞周期中的表达模式(图1.1(a))。一个物理通路利用Cdc28将Mobl连接到另一逡逑个转录调控因子FKH2,这个因子可能绑定调控了邋15个模块基因(图U(b))。物逡逑理模块网络模型的分析过程,其输入是基因表达数据,一组潜在的调控因子和已知逡逑蛋白-蛋白/蛋白-DNA相互作用;其学习过程是通过一个迭代的优化手段来搜索最优逡逑的模块及相应的调控因子和物理通路;其输出则是最优的物理模块及其上下游网络逡逑结构(图1.1(c))。逡逑(a)逦(b)逡逑Regulator逡逑WB灥瞧*81邋..WWW邋巧扣邋1逦巧eguistio。逡逑?逦起芒梦Path逡逑Tar屖S逦s逦.媂y卞蝹每逦逡逑Module逦1逦户巧逦、-一^逡逑%煎危牵卞义稀骸跺危畓吻伤撸插澹未模剩殄义希羁寂私藻澹五五义稀鲥危迹保穸剑剑桑桑伞海哄五义稀鲥危澹桑翦澹椋哄危掊危掊澹ǎㄥ危五义希煎巍霭耍璸骸贰⒃鰣;卢‘逡逑dm邋U1;-逦—逡逑!~+础,灥^逡逑化邋i逦"...—邋邋逦逦逦逦*逡逑!邋\邋■邋"1逡逑?邋■Gens邋g,pf株巧W逦逦邋逦逦逦X—*邋!逡逑.;?娭w始}!谢化巧:逦i邋WS邋逦\逦邋S逡逑;?护筑泌诞皆城於巧逦i逦;邋、:逦主逦茂I逡逑>??今;象;蚕巧?

点网络,边网,生物系,疾病


图2.1针对疾病生物系巧的点网络与边网络逡逑一般来说,上述方法都源于一个基本的数学模型:在随机动力学中,一个生逡逑物系统在分子水平上可W被一个主方程来建模[68,邋69]。如图2.1所示,在线性和逡逑高斯分布假设下,一个系统可W被两组方程准确的描述:一组是关于分子表达的逡逑平均值向量(即一阶信息),另一组是关于分子表达的协方差矩阵(即二阶信息)。逡逑然而,在传统网络(点网络)的研究中,如对基因网络或蛋白质相互作用网络的逡逑研巧,分子网络的构建都是基于平均值向量的方程组,而没用到基于协方差矩阵逡逑的方程组。显然,这种情况下构建的分子网络是无法完整反映原始生物系统的随逡逑机动力学特征的

基于多阶信息的复杂疾病分子网络研究


图2.邋3r>值筛选

【共引文献】

相关博士学位论文 前3条

1 朱俊;基于几何特征配准的图像鲁棒拼接算法[D];南京理工大学;2014年

2 葛新;互联网宏观拓扑度相关及社团特征研究[D];东北大学;2011年

3 胡国章;利用生物信息学方法筛选胶质瘤的差异表达基因及其相关机制[D];吉林大学;2015年



本文编号:2791058

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/2791058.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bdb24***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com