基于互信息网络的疾病关键基因选取
[Abstract]:In the post-genome era, the focus of life science research is no longer to study a single gene, but to study the operation mechanism of biological system at the level of genome structure and function. In this paper, some differentially expressed genes were screened out by gene expression profile data, and the structural differences of gene networks between normal group and disease group were analyzed. Based on the difference of gene intensity, medium and fault influence in mutual information network between normal group and disease group, the corresponding candidate disease key genes were sorted. The sequencing was optimized by the algorithm of social selection model, and the final aggregation sequence of genes was obtained and the key genes of disease were selected from them. The specific research contents are as follows: firstly, two groups of breast cancer data are downloaded from GEO database, one is pairwise data, the other is non-pairwise data. After the necessary data preprocessing of the two groups of data, about 300 differentially expressed genes were screened by SAM software. According to the expression profile data of these differentially expressed genes, the gene information correlation network between normal group and cancer group was constructed. Based on the analysis of the average degree and average kernel of the mutual information related network, it is found that there is a significant difference in the structure of the gene mutual information correlation network derived from the data of the normal group and the cancer group. In particular, the difference between non-pairwise data is more significant than that of pairwise data. According to the theory that structure determines function in biology, the difference of structure is the direct cause of functional difference. The node (gene) intensity, dielectric number and fault influence of the non-pairwise data were compared with the cancer group, and the corresponding gene sequencing was obtained according to the difference of the three parameters in the two networks. The Borda algorithm and Max-Diff algorithm in social choice theory are used for sorting aggregation. The results show that the final sequencing obtained by the two algorithms is almost the same, and 8 key disease genes are obtained in the first 15 genes of the final sequencing. This shows that both Borda algorithm and Max-Diff algorithm are suitable for the selection of key genes. In addition, another sequence aggregation Footrule algorithm is verified on a small scale. The results show that the Footrule algorithm pays too much attention to the overall sequencing and ignores individual genes. Therefore, Footrule algorithm is not suitable for the selection of key genes. The structural analysis of the above gene network and the selection of key genes can help us to analyze the causes and genes of gene-related diseases (such as cancer), and have certain reference value for the diagnosis and treatment of diseases.
【学位授予单位】:中国海洋大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13;R3416
【相似文献】
相关期刊论文 前10条
1 伍亚军;周正东;戴耀东;;基于特征点互信息预配准的医学图像配准技术[J];南京航空航天大学学报;2007年05期
2 李靖宇;沈焕泉;程燕;张淑丽;;基于最大互信息的医学图像配准算法[J];中国介入影像与治疗学;2010年03期
3 黄力宇,王伟勋,鞠烽炽,程敬之;用脑电互信息及复杂度预测异氟醚麻醉时患者对切皮刺激的反应[J];中国生物医学工程学报;2003年02期
4 康宏伟,耿力,赵玲,韩劲松,郭红燕,张璐芳;人正常宫颈鳞状上皮基因表达模式的研究[J];中国生育健康杂志;2004年05期
5 ;乳癌的基因表达模式揭示肿瘤的亚型及其与临床预后的关系[J];现代临床医学生物工程学杂志;2002年04期
6 郑全芳;杨志刚;孙红祥;;基因芯片在神经毒物学研究中的应用[J];中国兽药杂志;2006年02期
7 Moore D.H.;Chiu Y.S.Y.;N.M. Lee;王晓君;;结肠息肉患者正常结肠黏膜上基因表达的改变[J];世界核心医学期刊文摘(胃肠病学分册);2006年05期
8 Smith M.W.;Walters K.-A.;Korth M.J. ;M.G. Katze;成虹;;丙型肝炎相关的基因表达模式与肝移植受体早期进展为肝纤维化有关[J];世界核心医学期刊文摘(胃肠病学分册);2006年Z1期
9 周穗瑜;;猴子肺阻抗线性集总参数模型[J];国外医学(生物医学工程分册);1987年02期
10 徐京华,吴祥宝;以复杂度测度刻划人脑皮层上的信息传输[J];中国科学B辑;1994年01期
相关会议论文 前10条
1 何慧慧;严继舟;;Hox基因表达模式对成体干细胞迁移和巢居的影响[A];“细胞活动 生命活力”——中国细胞生物学学会全体会员代表大会暨第十二次学术大会论文摘要集[C];2011年
2 顾浩然;管弘;;频域与时域微波网络参数转换原理及应用[A];1989年全国微波会议论文集(上)[C];1989年
3 王惠生;;GSM-R网络参数ACCMIN的设置及对系统的影响[A];铁道科学技术新进展——铁道科学研究院五十五周年论文集[C];2005年
4 董树义;赵永久;路宏敏;;微波规准网络参数拟合模型与CAT[A];1991年全国微波会议论文集(卷Ⅱ)[C];1991年
5 梁昌洪;苏涛;;广义Foster定理和系统Q值[A];2001年全国微波毫米波会议论文集[C];2001年
6 邢悦;张卫东;杜大全;;二端口网络参数转换的程序实现方法及其误差传递分析[A];电工理论与新技术学术年会论文集[C];2005年
7 冯梅;米玉华;姜联成;;CC-Link现场总线的通信初始化方法及应用[A];第二届全国信息与电子工程学术交流会暨第十三届四川省电子学会曙光分会学术年会论文集[C];2006年
8 杜安源;;GSM无线网络载干比预测方法探讨[A];2007年中国通信学会“移动增值业务与应用”学术年会论文集[C];2007年
9 冯正和;郝建斌;;用网络-边界元法解旋转对称结构的电磁波电路[A];1987年全国微波会议论文集(上)[C];1987年
10 阎爱华;张韫玮;张立峰;刘猛;王冬梅;;叶锈菌侵染早期TcLr19 SSH文库构建及ESTs序列分析[A];中国植物生理学会第十次会员代表大会暨全国学术年会论文摘要汇编[C];2009年
相关重要报纸文章 前10条
1 北京 阮征;远程修改网络参数[N];电脑报;2004年
2 ;保护局域网中IP地址的实用招数[N];中国计算机报;2005年
3 北京中科红旗软件技术有限公司;红旗Linux桌面版5.0的配置和使用[N];中国计算机报;2006年
4 武君;网络优化因“段”制宜[N];通信产业报;2006年
5 Sitelite;通通透透设置无线局域网[N];计算机世界;2004年
6 赵洪;三招保护局域网中IP地址[N];中国计算机报;2007年
7 苏畅;北京联通春节网络不阻塞[N];人民邮电;2007年
8 韩登云 周春;银川商业银行网络工程改造成效明显[N];中国信息报;2006年
9 王席传;移动信号好的背后[N];人民邮电;2007年
10 本版编辑邋周晓娟 周文;TD打出网优组合拳[N];通信产业报;2008年
相关博士学位论文 前10条
1 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
2 林芬芳;不同尺度土壤质量空间变异机理、评价及其应用研究[D];浙江大学;2009年
3 王志勇;数据挖掘方法在短期负荷预测中的应用研究[D];浙江大学;2007年
4 胡青;基于电力变压器故障特征气体分层特性的诊断与预测方法研究[D];重庆大学;2010年
5 汪颖;单体型和基因型问题的优化模型和算法[D];大连理工大学;2007年
6 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
7 孙越泓;基于粒子群优化算法的图像分割研究[D];南京理工大学;2010年
8 邹央云;酵母倍增基因功能分化机制研究[D];复旦大学;2011年
9 张洪映;小麦逆境应答基因TaSnRK2.8的克隆与分析[D];西北农林科技大学;2011年
10 孙立平;玉米胞质Ⅰ类小分子量热激蛋白基因ZmHSP16.9的分离及功能分析[D];山东农业大学;2012年
相关硕士学位论文 前10条
1 刘玉堂;基于互信息网络的疾病关键基因选取[D];中国海洋大学;2013年
2 赵新明;互信息理论在Hilbert-Huang变换中的应用[D];太原理工大学;2011年
3 顾铖;图情档术语自动提取研究[D];南京大学;2011年
4 马世鑫;软件胎记选取技术研究[D];解放军信息工程大学;2012年
5 胡奇光;基于统计特征的DNA序列特征提取方法研究[D];湖南大学;2011年
6 张梦;类别不平衡条件下的小样本加密流量识别[D];哈尔滨工业大学;2013年
7 李煜;基于互信息的图像配准算法研究[D];武汉纺织大学;2012年
8 芦飞坚;基于互信息的医学图像配准算法研究及应用[D];首都师范大学;2013年
9 原媛;电力负荷特性分析及中长期负荷预测方法研究[D];上海交通大学;2008年
10 张峻豪;CT与超声数据配准的研究和实现[D];上海交通大学;2011年
本文编号:2504942
本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/2504942.html