当前位置:主页 > 医学论文 > 医卫管理论文 >

组学交互网络回归模型的构建策略与方法研究

发布时间:2020-11-02 16:31
   复杂疾病是跨组学生物标记联合作用的结果,但也绝不是它们之间的简单叠加和堆积,这些不同层面的组学标记,往往有基因组→转录组→蛋白组→代谢组→表型组的生物信息流时间的先后顺序,研究需遵循该连续谱的顺序,连续谱间相互错综,交织成一个组学生物网络系统,正是这个网络系统控制着疾病的发生、发展和转归进程。复杂疾病的多层面组学标记具备“高维”、“网络性”特性,传统的组学标记筛选策略和方法多数忽略了这两个特性,势必损失信息,甚至导致错误结果的出现。同时,生物分子之间的关系呈现出不同的非线性模式,简单的线性相关不足以刻画。本研究在网络医学框架下,首先引入点互信息用于表征组学交互网络中的“边效应”,并借助二维核密度方法估计、度量点互信息的取值,进而构建融组学交互网络的“点效应”、“边效应”为一体的组学交互网络回归模型,即点互信息组学网络回归模型。统计模拟用于评价该模型在不同的样本含量、不同的“边效应”模式,及其不同网络结构下I类错误率的稳定性和检验效能,来自GEO数据库的187例吸烟者的基因表达数据用来进一步验证该模型的实用性。方法生物分子之间存在复杂的相互调控关系,统计学中常用的简单线性相关,难以刻画这种复杂的调控关系,点互信息不仅可以度量两个变量之间的线性相关关系,同时也可以度量出两变量间的非线性相关关系。本研究首先引入点互信息,来表征组学生物网络中不同网络节点之间的相关关系,即网络的“边效应”,并利用二维核密度估计的方法,来估计两个组学网络节点间的点互信息值。进一步在logistic回归模型框架下,构建基于点互信息的组学网络回归模型,来识别整个组学交互网络、网络某特定组学标记节点或网络节点生物分子间的相互关系,如基因表达网络中的调控关系等,检验它们与复杂疾病的发生是否有关。本研究设计了两个模拟方案用,以评价模型的有效性和科学性:1.组学交互网络的网络结构固定不变,即每次模拟时,样本间网络差异节点和差异边都是固定不变的;2.随机指定样本间网络差异节点和差异边。在每个模拟方案下分别考虑两种不同的模拟情景:(1)网络中节点间的相关性是简单线性相关;(2)网络中节点之间的相关性是非线性相关。进一步,在每个模拟情景下设置四种网络差异情况:①网络中只有节点存在差异;②网络中只有边存在差异;③网络中节点和边都有差异,且差异的边与差异节点相连;④网络中节点和边都有差异,但差异边与差异节点不相连。这一系列的模拟,可从多角度评估本研究所构建的基于点互信息的组学网络回归模型,与生物信息学中常用的基于积距项的网络回归模型相比,在I类错误率控制表现和检验效能方面的科学性和有效性。结果根据研究的模拟结果显示:1.在两节点间的关系为线性时,两模型在不同情形下都能较好地控制I类错误率,且稳定在所设定的0.05左右。在差异节点的识别上,点互信息组学网络回归模型与积距项组学网络回归模型具有类似的检验效能,但与积距项组学网络回归模型相比,点互信息组学网络回归模型在差异边的识别上相对较弱;2.在两节点间的相关性为非线性情况下,积距项组学网络回归模型在差异节点的识别上具有较低的效能,在差异边的识别上,积距项组学网络回归模型几乎无法识别出差异边,而点互信息组学网络回归模型能够较好的识别出差异边,且同样具有很好的I类错误率的控制表现。将两个模型应用于187例吸烟者的基因表达数据,点互信息组学网络回归模型识别出了三个基因位点(AKT2、BAD和JAK3),积距项组学网络回归模型识别出来的二个基因位点(BAD和JAK3)。与此同时,点互信息组学网络回归模型识别出了四条条差异边(RAF1-MAP2K1、ERBB2-TGFA、CASP9-AKT2、PIK3CD-EML4),积距项组学网络回归模型未能够识别出差异边。文献检索发现,这些识别出来的差异节点和差异边,具有很好的生物学解释,进一步说明本研究提出模型具有很强的实用性。结论点互信息能够较好的提取组学交互网络中不同模式的“边效应”,在不同的模拟情形设置之下,点互信息组学网络回归模型均具有很好的I类错误率控制表现,无论组学生物网络中节点间存在线性或者非线性相关关系,点互信息组学网络回归模型能够较好地识别出差异节点和差异边,且对于不同的网络结构,点互信息组学网络回归模型的识别能力稳健性较好。
【学位单位】:山东大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:R-05
【部分图文】:

通路组,胰岛素抵抗,回归模型


可采用传统的Wald检验方法对其统计显著性进行假设检验。??模拟??为了能够使统计模拟更加贴近真实组学交互网络结构,本研究依托K库中包含26个组学节点和37条网络边的胰岛素抵抗通路的网络拓扑为产生模拟数据的基准N络结构(见图1),在不同样本量(《=300、40、600、1000)和不同节点间相关性模式(线性相关、非线性相关)情况模型的I类错误率的控制表现和检验效能,每次模拟设置均重复1000到本研宄所构建的基于点互信息的组学生物网络回归模型的主要特点互信息表征和度量组学生物网络的边效应,故本研宄选取生物信息学用的积距项组学生物卩彳络回归模型作为参照,来诠释点互信息组学网型模型的优劣,积距项组学N络回归模型首先使用简单线性相关来代间的连接强度和交互效应,进而构建组学生物网络回归模型。??IMCMXt)??
【相似文献】

相关期刊论文 前10条

1 陈文慧;余思敏;贺杰;张子豪;李军成;;基于2种回归模型的大学生校园贷原因分析及对策探讨[J];高师理科学刊;2018年11期

2 张莎;赵红;;分层回归与经典回归模型比较研究:以顾客资产驱动因素与忠诚意向的关系为例[J];数学的实践与认识;2010年08期

3 胡暖;非运动回归模型预测大学生最大摄氧量[J];山西师大体育学院学报;2004年04期

4 姜宝法;《Logistic回归模型—方法与应用》[J];预防医学文献信息;2002年05期

5 潘正义;用EXCEL解回归问题[J];天津农学院学报;1997年02期

6 田俊;;Cox回归模型及其参数估计[J];福建医学院学报;1987年02期

7 陈孝源;沈锦花;;新安江流域5—9月间汛期雨量预报的混合回归模型[J];应用概率统计;1987年04期

8 ;卫生统计[J];中国妇幼卫生杂志;1988年03期

9 冯可君 ,邓瑞玲 ,张绪军;一种多元单调回归模型及其在地图制图中运用的一例[J];测绘学报;1988年03期

10 马勤;建立最优营运回归模型[J];黑龙江财专学报;1988年03期


相关博士学位论文 前10条

1 康慧敏;基于随机回归模型的基因组选择“一步”法研究[D];中国农业大学;2017年

2 陈凯;基于深度学习和回归模型的视觉目标跟踪算法研究[D];华中科技大学;2018年

3 左珊珊;Meta-回归模型的统计诊断方法研究[D];云南财经大学;2018年

4 吴鑑洪;时间序列中回归模型的诊断检验[D];华东师范大学;2007年

5 于扬;混频数据回归模型的建模理论、分析技术研究[D];东北财经大学;2016年

6 张仕光;噪声特性的回归模型及其在短期风速预报中的应用[D];河北师范大学;2014年

7 陈永伟;似无关回归模型及其应用研究[D];华中科技大学;2008年

8 田茂再;回归模型的诊断理论与应用[D];南开大学;2001年

9 孟瑞锋;基于不同超声信号变换的食品溶液浓度检测研究[D];浙江大学;2012年

10 包姣;基于深度神经网络的回归模型及其应用研究[D];电子科技大学;2017年


相关硕士学位论文 前10条

1 李凯;基于拓展T过程回归模型的若干稳健估计方法[D];中国科学技术大学;2019年

2 林伟强;组学交互网络回归模型的构建策略与方法研究[D];山东大学;2019年

3 傅婷;边际回归模型的改进二次推断函数估计[D];苏州大学;2018年

4 谢杰;SGL门槛回归模型及其在股票分析中的应用[D];暨南大学;2018年

5 吴丹;基于可加回归模型的AQI时序特征分析[D];内蒙古大学;2018年

6 于媛媛;logistic回归模型在流行病学病因分析中的偏性及其改进策略研究[D];山东大学;2018年

7 丁改云;金融发展减缓多维贫困的门槛特征和空间溢出效应研究[D];西北大学;2018年

8 齐乐;基于MCMC方法的参数生存回归模型的贝叶斯估计[D];大连理工大学;2018年

9 缪继华;基于支持向量回归模型的序列采样方法研究[D];华中科技大学;2017年

10 张天;基于累积Logistic回归模型的雾霾天气概率估计研究[D];华北电力大学(北京);2018年



本文编号:2867285

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2867285.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47e8c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com