当前位置:主页 > 医学论文 > 实验医学论文 >

基于互信息网络的疾病关键基因选取

发布时间:2019-06-22 20:45
【摘要】:在后基因组时代,生命科学研究的重点不再是对单个基因进行研究,而是在基因组结构和功能的层次来研究生物系统的运行机理。本文利用基因表达谱数据筛选出部分差异表达基因,以此构建基因互信息相关网络,并对正常组和疾病组的基因网络的结构差异进行了分析;利用互信息网络中基因的强度、介数和故障影响力等参数在正常组和疾病组中的差异,得到相应的候选疾病关键基因排序,通过社会选择模型的算法对排序进行了优化聚合,得到基因的最终聚合排序并由此选取疾病关键基因。具体研究内容如下: 首先,从GEO数据库下载两组乳腺癌数据,一组为成对数据,一组为非成对数据。对两组数据进行必要的数据预处理后,利用SAM软件均筛选出约300个差异表达基因。根据这些差异表达基因的表达谱数据构建了正常组和癌症组的基因互信息相关网络。对互信息相关网络的平均度、平均核数等6个参数的分析发现,,正常组和癌症组数据所导出的基因互信息相关网络的结构存在显著差异。特别的,非成对数据的差异较成对数据更显著。按照生物学中结构决定功能理论,结构的差异性正是功能差异性的直接原因。 对非成对数据的基因互信息相关网络的节点(基因)强度、介数和故障影响力进行正常组与癌症组的比对,根据这3个参数在两个网络中的差异大小得到了相应的3个基因排序。利用社会选择理论中的Borda算法和Max-Diff算法进行了排序聚合,结果显示两个算法得到的最终排序几乎相同,均在最终排序的前15个基因中得到了8个疾病关键基因。这说明Borda算法和Max-Diff算法均适用于关键基因的选取。此外,对另一个序列聚合Footrule算法进行了小规模验证,结果发现,Footrule算法过于关注整体排序,而忽略了个别基因。因此,Footrule算法不适用于关键基因的选取。 上述基因网络的结构分析及关键基因选取的研究,能帮助我们分析与基因相关的疾病(如癌症)的发病原因及致病基因,对疾病的诊断和治疗有着一定的参考价值。
[Abstract]:In the post-genome era, the focus of life science research is no longer to study a single gene, but to study the operation mechanism of biological system at the level of genome structure and function. In this paper, some differentially expressed genes were screened out by gene expression profile data, and the structural differences of gene networks between normal group and disease group were analyzed. Based on the difference of gene intensity, medium and fault influence in mutual information network between normal group and disease group, the corresponding candidate disease key genes were sorted. The sequencing was optimized by the algorithm of social selection model, and the final aggregation sequence of genes was obtained and the key genes of disease were selected from them. The specific research contents are as follows: firstly, two groups of breast cancer data are downloaded from GEO database, one is pairwise data, the other is non-pairwise data. After the necessary data preprocessing of the two groups of data, about 300 differentially expressed genes were screened by SAM software. According to the expression profile data of these differentially expressed genes, the gene information correlation network between normal group and cancer group was constructed. Based on the analysis of the average degree and average kernel of the mutual information related network, it is found that there is a significant difference in the structure of the gene mutual information correlation network derived from the data of the normal group and the cancer group. In particular, the difference between non-pairwise data is more significant than that of pairwise data. According to the theory that structure determines function in biology, the difference of structure is the direct cause of functional difference. The node (gene) intensity, dielectric number and fault influence of the non-pairwise data were compared with the cancer group, and the corresponding gene sequencing was obtained according to the difference of the three parameters in the two networks. The Borda algorithm and Max-Diff algorithm in social choice theory are used for sorting aggregation. The results show that the final sequencing obtained by the two algorithms is almost the same, and 8 key disease genes are obtained in the first 15 genes of the final sequencing. This shows that both Borda algorithm and Max-Diff algorithm are suitable for the selection of key genes. In addition, another sequence aggregation Footrule algorithm is verified on a small scale. The results show that the Footrule algorithm pays too much attention to the overall sequencing and ignores individual genes. Therefore, Footrule algorithm is not suitable for the selection of key genes. The structural analysis of the above gene network and the selection of key genes can help us to analyze the causes and genes of gene-related diseases (such as cancer), and have certain reference value for the diagnosis and treatment of diseases.
【学位授予单位】:中国海洋大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13;R3416

【相似文献】

相关期刊论文 前10条

1 伍亚军;周正东;戴耀东;;基于特征点互信息预配准的医学图像配准技术[J];南京航空航天大学学报;2007年05期

2 李靖宇;沈焕泉;程燕;张淑丽;;基于最大互信息的医学图像配准算法[J];中国介入影像与治疗学;2010年03期

3 黄力宇,王伟勋,鞠烽炽,程敬之;用脑电互信息及复杂度预测异氟醚麻醉时患者对切皮刺激的反应[J];中国生物医学工程学报;2003年02期

4 康宏伟,耿力,赵玲,韩劲松,郭红燕,张璐芳;人正常宫颈鳞状上皮基因表达模式的研究[J];中国生育健康杂志;2004年05期

5 ;乳癌的基因表达模式揭示肿瘤的亚型及其与临床预后的关系[J];现代临床医学生物工程学杂志;2002年04期

6 郑全芳;杨志刚;孙红祥;;基因芯片在神经毒物学研究中的应用[J];中国兽药杂志;2006年02期

7 Moore D.H.;Chiu Y.S.Y.;N.M. Lee;王晓君;;结肠息肉患者正常结肠黏膜上基因表达的改变[J];世界核心医学期刊文摘(胃肠病学分册);2006年05期

8 Smith M.W.;Walters K.-A.;Korth M.J. ;M.G. Katze;成虹;;丙型肝炎相关的基因表达模式与肝移植受体早期进展为肝纤维化有关[J];世界核心医学期刊文摘(胃肠病学分册);2006年Z1期

9 周穗瑜;;猴子肺阻抗线性集总参数模型[J];国外医学(生物医学工程分册);1987年02期

10 徐京华,吴祥宝;以复杂度测度刻划人脑皮层上的信息传输[J];中国科学B辑;1994年01期

相关会议论文 前10条

1 何慧慧;严继舟;;Hox基因表达模式对成体干细胞迁移和巢居的影响[A];“细胞活动 生命活力”——中国细胞生物学学会全体会员代表大会暨第十二次学术大会论文摘要集[C];2011年

2 顾浩然;管弘;;频域与时域微波网络参数转换原理及应用[A];1989年全国微波会议论文集(上)[C];1989年

3 王惠生;;GSM-R网络参数ACCMIN的设置及对系统的影响[A];铁道科学技术新进展——铁道科学研究院五十五周年论文集[C];2005年

4 董树义;赵永久;路宏敏;;微波规准网络参数拟合模型与CAT[A];1991年全国微波会议论文集(卷Ⅱ)[C];1991年

5 梁昌洪;苏涛;;广义Foster定理和系统Q值[A];2001年全国微波毫米波会议论文集[C];2001年

6 邢悦;张卫东;杜大全;;二端口网络参数转换的程序实现方法及其误差传递分析[A];电工理论与新技术学术年会论文集[C];2005年

7 冯梅;米玉华;姜联成;;CC-Link现场总线的通信初始化方法及应用[A];第二届全国信息与电子工程学术交流会暨第十三届四川省电子学会曙光分会学术年会论文集[C];2006年

8 杜安源;;GSM无线网络载干比预测方法探讨[A];2007年中国通信学会“移动增值业务与应用”学术年会论文集[C];2007年

9 冯正和;郝建斌;;用网络-边界元法解旋转对称结构的电磁波电路[A];1987年全国微波会议论文集(上)[C];1987年

10 阎爱华;张韫玮;张立峰;刘猛;王冬梅;;叶锈菌侵染早期TcLr19 SSH文库构建及ESTs序列分析[A];中国植物生理学会第十次会员代表大会暨全国学术年会论文摘要汇编[C];2009年

相关重要报纸文章 前10条

1 北京 阮征;远程修改网络参数[N];电脑报;2004年

2 ;保护局域网中IP地址的实用招数[N];中国计算机报;2005年

3 北京中科红旗软件技术有限公司;红旗Linux桌面版5.0的配置和使用[N];中国计算机报;2006年

4 武君;网络优化因“段”制宜[N];通信产业报;2006年

5 Sitelite;通通透透设置无线局域网[N];计算机世界;2004年

6 赵洪;三招保护局域网中IP地址[N];中国计算机报;2007年

7 苏畅;北京联通春节网络不阻塞[N];人民邮电;2007年

8 韩登云 周春;银川商业银行网络工程改造成效明显[N];中国信息报;2006年

9 王席传;移动信号好的背后[N];人民邮电;2007年

10 本版编辑邋周晓娟 周文;TD打出网优组合拳[N];通信产业报;2008年

相关博士学位论文 前10条

1 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年

2 林芬芳;不同尺度土壤质量空间变异机理、评价及其应用研究[D];浙江大学;2009年

3 王志勇;数据挖掘方法在短期负荷预测中的应用研究[D];浙江大学;2007年

4 胡青;基于电力变压器故障特征气体分层特性的诊断与预测方法研究[D];重庆大学;2010年

5 汪颖;单体型和基因型问题的优化模型和算法[D];大连理工大学;2007年

6 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年

7 孙越泓;基于粒子群优化算法的图像分割研究[D];南京理工大学;2010年

8 邹央云;酵母倍增基因功能分化机制研究[D];复旦大学;2011年

9 张洪映;小麦逆境应答基因TaSnRK2.8的克隆与分析[D];西北农林科技大学;2011年

10 孙立平;玉米胞质Ⅰ类小分子量热激蛋白基因ZmHSP16.9的分离及功能分析[D];山东农业大学;2012年

相关硕士学位论文 前10条

1 刘玉堂;基于互信息网络的疾病关键基因选取[D];中国海洋大学;2013年

2 赵新明;互信息理论在Hilbert-Huang变换中的应用[D];太原理工大学;2011年

3 顾铖;图情档术语自动提取研究[D];南京大学;2011年

4 马世鑫;软件胎记选取技术研究[D];解放军信息工程大学;2012年

5 胡奇光;基于统计特征的DNA序列特征提取方法研究[D];湖南大学;2011年

6 张梦;类别不平衡条件下的小样本加密流量识别[D];哈尔滨工业大学;2013年

7 李煜;基于互信息的图像配准算法研究[D];武汉纺织大学;2012年

8 芦飞坚;基于互信息的医学图像配准算法研究及应用[D];首都师范大学;2013年

9 原媛;电力负荷特性分析及中长期负荷预测方法研究[D];上海交通大学;2008年

10 张峻豪;CT与超声数据配准的研究和实现[D];上海交通大学;2011年



本文编号:2504942

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/2504942.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e589b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com