当前位置:主页 > 医学论文 > 实验医学论文 >

面向基因表达数据的致病基因挖掘方法研究

发布时间:2019-05-11 05:57
【摘要】:复杂疾病致病基因挖掘对于了解疾病的发病机理和提高医学临床水平具有重要的意义。生物信息学作为当今生命科学研究的重要途径,通过揭示人类基因组及遗传语言的规律,挖掘威胁人类健康的各种疾病的致病基因,提高人类对疾病的认识及治疗水平。随着许多高通量实验技术手段的不断发展和完善,多种类型的隐含着生命本质规律与疾病信息的生物数据正迅猛增长,如何利用生物信息学方法从这些海量数据中获得有用的信息,挖掘出与复杂疾病相关的基因已成为具有挑战意义的新课题。基因芯片表达谱检测技术是基因组学研究方法的重要突破,大规模的基因表达数据为基因功能研究提供了新的机遇,促进了复杂疾病致病基因挖掘、致病基因网络关系及疾病亚型分析的研究进展。各种功能强大的致病基因预测软件也为致病基因研究提供了便捷的途径。 本文研究目的是用生物信息学方法对基因表达数据分析处理,挖掘出隐含在基因表达数据中的与疾病相关的基因,并运用各种致病基因预测软件对潜在的致病基因进行排序,得到疾病基因的相关信息,提高人类对疾病机理的认识。本文的主要工作及创新性成果如下: 1.提出了基于奇异值分解的致病基因挖掘算法LRSVD。针对奇异值分解(SVD)方法中用奇异值方差评估特征模式的不足,提出用Logistic回归系数代替方差评估每一个特征模式对分类的作用大小。进一步提出了基因内积的定义,建立了特征模式与原始基因表达数据之间的线性映射关系,基因内积可用来评估每一条基因的分类能力,根据基因内积的大小对基因排序,选择对样本分类能力高的基因。将LRSVD算法应用于基因表达数据,得到了一组分类准确率高的基因子集,这些基因与疾病相关。 2.提出了基于改进的混沌变异离散粒子群的特征基因选择算法CMDPSO。基本离散粒子群算法由于粒子在运动过程中产生惰性而发生早熟收敛,CMDPSO算法引入了混沌机制和遗传算法的变异机制,混沌作为一种优化机制可用来产生初始粒子,其遍历性使初始粒子将新的模式不断引入到搜索空间,并对适应度低的粒子进行初始化,利用遗传算法的变异机制避免粒子陷入局部极值,从而快速得到最优解。CMDPSO算法应用于基因表达数据,得到了优化的基因子集。 3.提出了基于互信息和最大团的差异共表达致病基因挖掘方法MIClique。互信息作为相似性度量函数评估基因之间的共表达关系,得到基因在不同样本中的互信息值矩阵,选取阈值将互信息矩阵二值化,将不同样本中的二值化矩阵的元素进行‘与’操作,将得到的矩阵转化为图的邻接矩阵;提出了用最大团方法从图的邻接矩阵中挖掘具有差异共表达模式的基因模块,最大团中的顶点代表基因,线代表基因之间的相互作用关系。MIClique算法避免了穷举式的基因搜索,能快速挖掘出差异共表达致病基因模块。对MIClique方法挖掘出的基因模块,不仅研究单个基因的生物功能,并研究基因共同参与的生物通路及产生共表达模式的生物机制。 4.介绍了目前常用的致病基因预测软件,提出了用ENDEAVOUR软件来预测基因GAD2是否为肥胖症致病基因,讨论了训练基因和数据类型的选择,并从各生物数据库和生物文献中挖掘基因GAD2与肥胖症的相关性,预测结果有利于对其它研究者得出的相互矛盾的结论作出新的解释。 最后,对整个论文的工作、研究成果及创新点进行了总结,提出了进一步的研究方向和目标。
[Abstract]:......
【学位授予单位】:南京航空航天大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP311.13;R346

【相似文献】

相关期刊论文 前10条

1 王士同;修宇;;基于模型的基因表达聚类分析技术研究进展[J];江南大学学报(自然科学版);2006年03期

2 张黎;逄涣利;王小虎;王佳;;一种共调控基因C均值模糊聚类算法[J];计算机工程与应用;2010年07期

3 高倩倩;须文波;孙俊;;量子行为粒子群算法在基因聚类中的应用[J];计算机工程与应用;2010年21期

4 刘云如;蔡立军;易叶青;;基于G-ICA的组织样本分类算法[J];计算机工程与应用;2010年31期

5 李巧;孔薇;;改进的非负矩阵分解在基因表达数据中的应用[J];信息技术;2010年12期

6 徐旭东;郑欣;;基于Struts的基因表达数据分析软件的设计与实现[J];微电子学与计算机;2006年S1期

7 王艳;骆嘉伟;杨涛;吴君浩;;基于分段与运算的基因表达数据频繁项集挖掘[J];计算机工程与科学;2006年11期

8 曹晖;席斌;米红;;一种新聚类算法在基因表达数据分析中的应用[J];计算机工程与应用;2007年18期

9 寇晨艳;郭红;;基因表达数据的频繁模式挖掘算法[J];福州大学学报(自然科学版);2009年02期

10 朱娴;马卫;;一种基于层次聚类的双聚类算法[J];微计算机应用;2009年05期

相关会议论文 前10条

1 陈军;潘艳;唐世星;张吉强;易东;;小脑基因表达数据的模糊多尺度聚类分析[A];重庆市预防医学会2010年论文集[C];2011年

2 杨昆;李建中;王朝坤;徐继伟;;基因表达数据的基于类别树和SVMs的多类癌症分类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

3 王章辉;赵宇海;王国仁;李源;;一种基于投影聚类的无监督表型区分算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

4 徐旭东;郑欣;;基于Struts的基因表达数据分析软件的设计与实现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

5 李鹏;阮晓钢;;一种预测多骨髓瘤的神经网络方法[A];第二十二届中国控制会议论文集(下)[C];2003年

6 杨波;卢学春;于力;朱宏丽;范辉;姚善谦;楼方定;;靶向上调ID4基因表达药物的生物信息学预测、分析和初步验证[A];第12届全国实验血液学会议论文摘要[C];2009年

7 崔光照;曹祥红;张华;;基于小波变换的基因表达数据去噪聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年

8 梅桢;申琦;冶保献;;用于基因表达数据模式识别的KNN和SVM集成算法[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

9 张文广;李金泉;菊林花;赖双英;;应用Affymetrix基因芯片数据集开发基因表达的秩分析方法[A];遗传学进步与人口健康高峰论坛论文集[C];2007年

10 卢学春;杨波;于力;朱宏丽;范辉;姚善谦;楼方定;;靶向上调ID4基因表达药物及其抗白血病作用的生物信息学预测、分析和验证[A];中国科协海峡两岸学术研讨会——2008血液肿瘤论坛会议会编[C];2008年

相关博士学位论文 前10条

1 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年

2 陆慧娟;基于基因表达数据的肿瘤分类算法研究[D];中国矿业大学;2012年

3 程慧杰;基于模式识别方法的基因表达数据分析研究[D];哈尔滨工程大学;2012年

4 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年

5 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年

6 王广云;肿瘤基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2009年

7 蔡立军;基因分类及基因表达数据分析方法的研究[D];湖南大学;2007年

8 邱浪波;基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2007年

9 缪裕青;关联规则挖掘及其在基因表达数据中的应用[D];中国科学技术大学;2007年

10 杨锡南;基于基因芯片表达谱的癌症预后元分析方法研究[D];东南大学;2006年

相关硕士学位论文 前10条

1 邓庆山;聚类分析及其在基因表达数据中的应用研究[D];华中科技大学;2004年

2 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年

3 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年

4 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年

5 张礼;寻找差异基因的概率方法研究[D];南京航空航天大学;2010年

6 张彦琦;基因调控网络建立的数学模型研究[D];第三军医大学;2003年

7 邓小燕;谱聚类在基因表达数据分析中的应用与研究[D];重庆大学;2010年

8 张志国;基于生成树基因表达数据聚类方法分析[D];东北大学;2006年

9 刘楠楠;应用于基因表达数据的双聚类算法的研究[D];燕山大学;2011年

10 沈小乔;基因表达数据分类算法及其应用研究[D];湖南大学;2005年



本文编号:2474293

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/shiyanyixue/2474293.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户151d8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com