当前位置:主页 > 医学论文 > 妇产科论文 >

基于队列研究和生物信息学数据挖掘初步探讨HBV宫内感染影响因素

发布时间:2020-04-14 17:25
【摘要】:目的:1.通过前期队列研究了解武汉市HBsAg阳性孕妇乙型肝炎病毒(hepatitis B virus,HBV)宫内感染的流行现状,明确HBV宫内感染的主要影响因素。2.构建新生儿HBV宫内感染的风险预测模型,并评价不同模型在HBV宫内感染诊断中的泛化能力,以期从宏观流行病学方面探讨HBV宫内感染危险因素。3.使用公共数据库对与HBV宫内感染相关的基因进行二次挖掘,以期从生物信息学方面探讨与HBV宫内感染相关的基因。方法:1.第一部分以2012年5月至2016年12月期间进入乙肝母婴传播队列的HBsAg阳性孕妇及其新生儿为研究对象,按照出生时检测新生儿股静脉HBsAg或HBV DNA为阳性作为HBV宫内感染诊断标准,分析HBsAg阳性产妇的年龄、孕期疾病、HBV血清学暴露因素与HBV宫内感染之间的关系。2.第二部分以新生儿是否发生HBV宫内感染为结局,采用非条件Logistic回归模型、决策树模型和BP神经网络模型构建新生儿HBV宫内感染的风险预测模型,并通过ROC曲线下面积比较三种模型,通过选取不同预测样本量来评价三种模型的泛化能力。3.结合前期研究筛选出的HBV宫内感染易感基因,使用GEO数据库中HBV表达谱芯片GSE51489和GSE83148中按照1.2倍数改变(fold change,FC)(logFC1.2)和P0.05的标准筛选候选基因。对GSE51489和GSE83418两条表达谱芯片初次筛选的12个候选基因进行GO(Gene Ontology)生物富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路分析,同时纳入表达谱芯片GSE65389进行验证。结果:1.在1529名HBsAg阳性孕妇分娩的1544名新生儿中,HBV宫内感染的发生率为7.06%(109/1544)。HBeAg阳性孕妇分娩的新生儿感染HBV的风险较HBeAg阴性孕妇分娩的新生儿高(RR=3.98,95%CI:2.66-5.94);HBV DNA阳性孕妇分娩的新生儿发生HBV宫内感染风险是HBVDNA阴性孕妇的2.961倍(RR=2.96,95%CI:2.00-4.39);新生儿HBV宫内感染率随着孕妇孕晚期HBV DNA载量的升高而升高(χ~2_(CMH)=50.380,P0.001)。2.(1)多因素非条件Logistic回归模型显示:母亲孕期HBeAg阳性(OR=3.14,95%CI:1.96-5.01)、孕晚期HBV DNA载量高(OR=1.88,95%CI:1.19-2.98)均是发生HBV宫内感染的危险因素;此外,剖宫产与HBV宫内感染发生风险的降低显著相关(OR=0.41,95%CI:0.27-0.61)。Logistic回归模型ROC曲线下面积为0.731(95%CI:0.66-0.80)。(2)决策树模型分析结果显示:孕期HBeAg、孕晚期HBV DNA和分娩方式进入模型。首先进入决策树模型的因素是孕期HBeAg(χ~2=51.178,P0.001),并形成2个子集:阴性和阳性。其中,第一个阳性子集中,分娩方式进入分类树(χ~2=20.626,P0.001),并形成2个亚子集:剖宫产和顺产。在剖宫产亚子集中,孕晚期HBVDNA进入分类树(χ~2=7.621,P0.01),模型的ROC曲线下面积为0.667(95%CI:0.59-0.74)。(3)BP神经网络模型结果显示:有1个隐藏层,隐藏层中有3个单位,预测变量对HBV宫内感染发生风险影响的重要性排名前五位的依次为:孕期HBeAg、孕晚期HBV DNA、孕次、月经规律和分娩年龄,模型的ROC曲线下面积为0.668(95%CI:0.58-0.72)。(4)对三个模型ROC曲线下面积进行两两比较,差异无统计学意义(P0.05)。分别使用30%、20%和10%的预测样本量分布评估三个模型的泛化能力,发现每个模型在不同预测样本量下的AUC比较无统计学意义(P0.05),说明预测模型较为稳定,可以用于HBV宫内感染的预测。3.GSE51489和GSE83148共同筛选出12个差异表达的基因:RGS1、PDE4B、MAFF、PMAIP1、JUND、PHLDA1、FOS、LAIR2、RGCC、CXCL8、SIK1、CCL20。通过GO分析和KEGG通路分析发现这12个候选基因主要富集在与免疫功能相关的疾病与通路上。PPI网络分析发现候选基因PPI之间关系非常紧密,并且FOS、JUN、ATF3位于网络的中心。在GSE65389中对PPI网络蛋白及前期分子流行病学研究中筛选出来的基因进行验证,发现TNFAIP3、CDKN1A、CD44、CXCL8、CCL20、CXCL13、PDCD1、LTA、MARS、TLR3、TLR4、SLC10A1均出现在验证的表达谱芯片中,且TNFAIP3、PDCD1、LTA和TLR3基因在GSE65389中HBV感染组与正常对照组表达差异有统计学意义(P0.05)。结论:1.武汉市HBsAg阳性孕妇HBV宫内感染的发生率为7.06%。孕期HBeAg阳性、孕晚期HBV DNA阳性是HBV宫内感染发生的危险因素,剖宫产是HBV宫内感染的保护因素。2.三个预测模型均提示母亲孕期HBeAg、孕晚期HBV DNA和分娩方式在乙肝宫内感染风险预测中起着十分重要的作用。本次研究的三个预测模型均可以用于HBV宫内感染的预测。3.通过对HBV感染芯片数据的挖掘及生物信息学分析,筛选出差异表达基因,发现这些基因主要富集在与免疫功能相关的疾病与通路上。结合前期队列研究出的与HBV宫内感染相关的基因,在目标表达谱芯片中验证出TNFAIP3、PDCD1、LTA和TLR3在实验组和对照组中表达差异,为研究HBV感染乃至HBV宫内感染的提供新的基因和研究方向。
【图文】:

模型图,决策树,模型


次研究建立 Logistic 回归模型,首先按照一部分筛选出的入到多因素分析中,采用前进式逐步回归的方法,纳入标 0.10,进行多因素非条件 Logistic 回归分析,构建 Logist因素的 OR 值和其上下限的 95%置信区间(95%CI),并决策树模型的构建1 基本结构研究决策树模型运用分类树方法(Classification Tree MethCHAID 计算法则,生成决策树。穷举 CHAID 其中包括了“作用”和“检验”几个核心内容[19]。“卡方”说明了统计学检测作用”说明此次检验预测中各个变量之间关系;“检验”指此;“自动”指代这项技术的可操作性。其中心思想是:通过佳的合并点,分类变量采用两两比较,连续变量采用合并策树由于数据的噪音较多,往往通过树枝剪切来降低过分枝可以清晰提示对结局变量最有影响的因素。经过剪枝之2-1。

神经元模型


图 2-2 神经元模型描述神经元模型的函数方程式来如下:{ ∑ =1 ( )其中,Xj(j=1,2,…,n)为从上一节神经元传入的信号,θj示从神经元 i 到 j 的连接权值。f(xj)为神经元的激活函数,通过神信号加权和而产生。②神经网络拓扑结构:神经网络拓扑结构分为前馈神经网络;反馈组织网络。前馈神经网络为最常见得一种,图 2-3 展示了多层前馈型,,它分为三层:输入层、隐含层和输出层,层层连线表示可以通之间得权相连接。其中每层权都不回送到前一层的单元,所以成为络。③学习规则:是修改神经网络参数的规则或算法,以便网络的给定的输出。这种学习过程通常相当于修改网络内变量的权重和阈值。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:R714.251

【参考文献】

相关期刊论文 前10条

1 梁栋;张凤琴;陈大武;李小青;王梦非;;一种基于决策树和遗传算法-BP神经网络的组合预测模型[J];中国科技论文;2015年02期

2 王巍;吴福敢;胡肖玲;马海兰;陆敏玉;李美玲;;女性乙肝病毒携带者体外受精-胚胎移植妊娠结局分析[J];中国优生与遗传杂志;2014年06期

3 李力;;“乙型肝炎病毒母婴传播预防临床指南(第1版)”解读[J];中华妇幼临床医学杂志(电子版);2014年02期

4 肖晗;吴旗;艾洪武;;HBsAg阳性孕妇宫内感染相关因素研究[J];中华医院感染学杂志;2013年09期

5 赵紫奉;李韶斌;孔抗美;;基于决策树算法的疾病诊断分析[J];中国卫生信息管理杂志;2011年05期

6 张芬;余金明;王家宏;毛勇;张李军;李社昌;战义强;胡大一;;Exhaustive CHAID分类树与logistic回归在脑卒中危险因素中的应用[J];中国预防医学杂志;2011年07期

7 杜旦;王睿;王玉;;兰州市乙肝患者及其家属乙型肝炎KAP调查分析[J];中华疾病控制杂志;2011年04期

8 黄克峰;;拉米夫定对胎盘组织细胞凋亡的影响[J];药物流行病学杂志;2010年05期

9 陈桂兰,黄天华,谢庆东,王晓梅,熊小芳;卵母细胞携带的HBV DNA在小鼠早期胚胎中的复制与表达[J];癌变.畸变.突变;2005年03期

10 ;Presence and integration of HBV DNA in mouse oocytes[J];World Journal of Gastroenterology;2005年19期

相关博士学位论文 前10条

1 尹文娇;乙型肝炎病毒母婴传播阻断的分子流行病学研究[D];中国疾病预防控制中心;2017年

2 倪然;基于流行病学、临床症状、肿瘤标志和影像学特征的肺癌诊断模型的建立[D];郑州大学;2016年

3 刘阳;早期肝癌疗效评价的贝叶斯网络meta分析及用微血管侵犯风险预测指导个体化消融治疗[D];第二军医大学;2016年

4 谢道文;基于数据挖掘的火灾分析模型及应用研究[D];中南大学;2014年

5 张捷;进化算法及智能数据挖掘若干问题研究[D];西安电子科技大学;2013年

6 杨振舰;可视化数据挖掘技术在城市地下空间GIS中的应用研究[D];河北工业大学;2012年

7 吴波;造纸过程能源管理系统中数据挖掘与能耗预测方法的研究[D];华南理工大学;2012年

8 刘太安;基于支持向量机的空间数据挖掘方法及其在旅游地理经济分析中的应用[D];中国矿业大学;2012年

9 冉鹏;基于动态数据挖掘的电站热力系统运行优化方法研究[D];华北电力大学;2012年

10 袁冠;移动对象轨迹数据挖掘方法研究[D];中国矿业大学;2012年

相关硕士学位论文 前2条

1 冯晓蕾;基于人血浆microRNAs的数据挖掘技术构建肺癌预测系统[D];郑州大学;2017年

2 刘畅;新生儿乙型肝炎病毒宫内感染传播途径的分子机制研究[D];中国人民解放军军事医学科学院;2016年



本文编号:2627527

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/fuchankeerkelunwen/2627527.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1084a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com