当前位置:主页 > 医学论文 > 医卫管理论文 >

复杂网络分析方法在全基因组关联研究中的应用

发布时间:2020-03-18 15:21
【摘要】:全基因组关联分析(Genome-wide association study,GWAS)是指在基因水平上,进行关联分析来找出疾病相关的基因的方法。近年来,生物学工作者对GWAS进行了深入的研究,也找到了很多有效的方法,这些方法能够解决一些问题,但是也存在很多不足,存在一些难以克服的困难。一方面,许多方法在一个模型上适用,但转到另外的模型上时,效果甚微,不能够适合所有的情形以及多因素复杂致病的需求。当解决多模型问题时,往往效率低下,准确率较低,达不到预期的效果。另一方面,以往的实验都是关于单个SNP而进行的,并没有提到不同的SNP之间有关联关系时起到的作用。针对上述难题,本文提出一种新的互信息的结构性关键SNPs集合选取的方法。本文在互信息理论和仿真数据的基础之上,来逆向构建SNPs的互信息网络。给定互信息一个阈值范围,从而找到对应的阈值下的相关统计量进行比较分析,进而选取出合适的阈值。根据选取阈值,筛选出对网络结构有明显影响效果的“结构性关键SNPs”。国际HapMap项目提供了大量关于13号染色体上基因信息,其中包括BRCA2基因信息。在实验中,通过预设的2个致病的SNPs,结合HAPGEN2软件,得到大量病例组对照组的仿真数据,建立基于互信息的疾病相关网络。通过多次实验比较互信息网络中的结构参数,可以得到:在互信息的阈值范围内,阈值的不断增加,多个网络统计量可以把对照组和病例组进行区分。对于具有一定阈值的互信息网络,计算所有节点在病例组、对照组不同取值下各个统计量的变化情况,发现平均度能够明显地区分两组,因此选择平均度作为区分依据,从而由此阈值选择出对网络结构具有较大影响的“结构性关键SNPs”集合。多次实验结果表明:本文采用的参数取值方法能够方便准确地筛选出对网络结构有明显影响效果的关键SNPs。关键SNPs集合选取的方法能够有效地筛选出仿真数据时设定的致病SNPs。最后,本文的方法在脑胶质瘤数据上得到验证,检测到NF2和TP53等致病基因,并对脑胶质瘤易感基因进行了预测。
【图文】:

变化曲线,阈值,统计量,病例


图 5-1 4 个网络结构的统计量随阈值的增加的变化情况,其中,纵坐标表示相应的统计量,,横坐标代表阈值,蓝色表示对照组数据显示效果,红色表示病例组数据显示效果。Fig 5-1. Four statistics under different thresholds, where ordinate represents the statistics, theabscissa represents the threshold value, and the blue represents the display effect of the control groupthen red for case data病例组和对照组网络中平均路径长度 随阈值变化的比较可以看出,当 ≤ ≤ 时,病例组与对照组的网络有相对明显的差异。于是我们可以得到,在这个变化区间内,平均路径长度可以很好的区分病例组和对照组,而当 t>0.43 时,网络的边越来越少,平均路径长度趋近于 0。由网络的平均度 随阈值增加的变化曲线中可以发现,在很长的一段阈值范围内,病例组与对照组的网络平均度有很大的区别,而随着网络的阈值增加,网络的平均度越来越小,这与网络的孤立点越来越多也是相对应的。当 t>0.62 时,病例、对照组中都只有一个包含四个节点的全耦合子网,平均聚类系

阈值,组图,病例,统计量


从图 5-2 中我们得到每个统计量能够区分两组的阈值范围,如下表:表 5-2 各统计量能够区分病例组和对照组的阈值范围Table 5-2. Thresholds which can distinguish case and control网络统计量 阈值范围平均度( ) 0.09-0.34模块度( ) 0.2-0.28平均路径长度( ) 0.2-0.3平均介数( ) 0.21-0.3从表 5-2 可以看出,每一个统计量都有不同的阈值范围,平均度 的范围较 ≤ ≤ ;其他的几个统计量阈值范围相差不大,基本在 0.2 到 0.3 之间。图 5-1,选择 0.27 为阈值构建网络。
【学位授予单位】:中国石油大学(华东)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R-05;O157.5

【相似文献】

相关期刊论文 前10条

1 蒋雪丽;张宇清;;动脉僵硬度与卒中的关联研究进展[J];中国卒中杂志;2017年02期

2 全赞荣;;动脉硬化性脑梗死与人类MHC-DR基因多态性的关联研究[J];中国伤残医学;2009年03期

3 Jeremy Cherfas;王浩鑫;;全基因组研究仍在展示“关联研究”的力量[J];科学观察;2013年04期

4 杨英;鲁向锋;;冠心病全基因组关联研究进展[J];遗传;2010年02期

5 陈曦;曹芳萍;温玲玉;李尚穗;杨国湘;;绿色产品品牌信任、满意度与再购意愿关联研究[J];林业经济评论;2016年01期

6 ;2011年全基因组关联研究国际论坛会议通知[J];中国麻风皮肤病杂志;2011年04期

7 李延健;佘强;;心房颤动的全基因组关联研究进展[J];医学综述;2014年05期

8 厚磊;姜晶梅;;高血压易感基因关联研究的现状与统计学对策[J];中华高血压杂志;2013年06期

9 郭园园;肖力;孙林;刘伏友;;全基因组关联研究在复杂性疾病遗传研究中的应用[J];现代生物医学进展;2012年04期

10 沈鑫;马依彤;;全基因组关联研究在冠心病遗传学中的应用进展[J];医学综述;2012年09期

相关会议论文 前10条

1 刘军;;儿茶酚氧位甲基转移酶基因多态性与剂末现象的关联研究[A];中华医学会第十七次全国神经病学学术会议论文汇编(上)[C];2014年

2 段巍巍;张秋伊;陈海;;基于肺癌全基因组关联研究数据的疾病风险预测[A];2015年(第四届)全国大学生统计建模大赛论文[C];2015年

3 张福仁;黄薇;陈树民;孙良丹;刘红;杨森;刘建军;张学军;;全基因组关联研究定位麻风的易感基因[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年

4 李欢;张晓博;陈红岩;卢大儒;;基于全基因组关联研究的中国肺癌风险预测模型研究[A];2012年中国青年遗传学家论坛会议文集[C];2012年

5 郑春明;王彦;范钰;许琪;沈岩;;多巴胺转运体基因多态性与偏执型精神分裂症的关联研究[A];遗传学与社会可持续发展——2010中国青年遗传学家论坛论文摘要汇编[C];2010年

6 郭倩;姜磊;殷健;黄少兰;赵静;刘_g;张立斌;吴歆;徐沪济;;Nanodrop检测中260/230值对全基因组关联研究样本质检的重要意义[A];第17次全国风湿病学学术会议论文集[C];2012年

7 马翔宇;许斌;张耀;李亚斐;熊鸿燕;;罕见遗传变异关联研究进展[A];第七次全国流行病学学术会议暨中华预防医学会流行病学分会、中华医学会中华流行病学杂志编辑委员会第七届换届会议论文集[C];2014年

8 陶华;李克深;赵斌;;MIR155HG/miR-155基因单核苷酸遗传变异与癫痫易感性的关联研究[A];中华医学峰会暨中华医学会神经病学分会第八届全国中青年神经病学学术会议论文汇编[C];2015年

9 董长征;;基于全基因组关联研究的网络分析揭示冠心病的易感网络模块[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年

10 钱圆;袁建辉;姜慧勤;宋天野;;我国能源消耗、经济增长与二氧化碳排放的关联研究——以华东地区为例[A];第七届中国科技政策与管理学术年会论文集[C];2011年

相关重要报纸文章 前6条

1 通讯员 冯立中 记者 蒋家平;我学者发现麻风、精神分裂症易感基因[N];科学时报;2011年

2 安徽医科大学皮肤病研究所 孙良丹 复旦大学皮肤病研究所 张学军;从全基因组关联研究到精准医学[N];健康报;2019年

3 ;近年通胀与经济形势关联研究[N];上海证券报;2005年

4 记者 胡德荣;2型糖尿病全基因组关联研究获重大进展[N];健康报;2012年

5 记者 陈江 通讯员 黎霞;我区莫曾南教授在《自然》在线发表论文[N];广西日报;2012年

6 丁香 编译 丁萍 评论;基因检测价值有限?[N];医药经济报;2009年

相关博士学位论文 前10条

1 杨健康;中国汉族人群重型痤疮的全基因组关联研究[D];云南大学;2014年

2 张鸣凤;全基因组通路分析策略应用于皮肤基底细胞癌易感性的关联研究[D];南京医科大学;2012年

3 李元丰;HBV相关肝病的全基因组关联研究[D];中国人民解放军军事医学科学院;2016年

4 潘华;超重/肥胖、幽门螺杆菌感染与胃癌的关联研究[D];兰州大学;2014年

5 朱猛;低频遗传变异与肺癌遗传易感性及预后关联研究[D];南京医科大学;2017年

6 朱小泉;中国北方群体中强直性脊柱炎的候选基因关联研究DA2B的病因学研究[D];中国协和医科大学;2009年

7 王晔;视网膜神经节细胞发育调控网络基因单核苷酸多态性与原发性开角型青光眼的关联研究[D];青岛大学;2011年

8 胡纯严;肺结核X染色体易感基因及全基因组关联研究[D];中国人民解放军军事医学科学院;2015年

9 刘瑶;中国华东地区慢性乙型肝炎病毒感染的全基因组关联研究[D];南京医科大学;2013年

10 董静;中国汉族人群肺癌全基因组关联研究[D];南京医科大学;2012年

相关硕士学位论文 前10条

1 张善强;复杂网络分析方法在全基因组关联研究中的应用[D];中国石油大学(华东);2017年

2 余琦新;延安文艺与大众的关联研究[D];湖北师范大学;2019年

3 姚婷;CUDA平台下基于通路的全基因组关联研究[D];湖南大学;2014年

4 毛丽媛;基于多特征融合及深度学习的内容关联研究[D];北京邮电大学;2018年

5 龚云峰;上市公司股权结构与效益的关联研究[D];苏州大学;2002年

6 李冠伟;区域人力资本与产业结构调整关联研究——以山东省为例[D];山东师范大学;2003年

7 徐平莉;新加坡华语文教育政策与华文测试的关联研究[D];暨南大学;2017年

8 张洁;决策树模型在冠心病全基因组关联研究中的应用[D];复旦大学;2013年

9 崔凯;基于随机森林的全基因组关联研究[D];湖南师范大学;2016年

10 段志强;我国煤矿事故与产权制度的关联研究[D];南京理工大学;2007年



本文编号:2588882

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2588882.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2ce0a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com