微阵列基因表达数据混合特征算法研究
本文选题:微阵列基因表达 切入点:Filter法 出处:《沈阳工业大学》2017年硕士论文 论文类型:学位论文
【摘要】:DNA微阵列技术是由生物学,融微电子学、计算机科学和广电化学为一体,在原来核酸杂交的基础上发展起来的一项新技术,在医学和生物学的研究中得到了高度重视。近几年来,随着大规模高通量微阵列技术的快速发展,在一次实验中获得成千上万个基因的表达水平成为现实。这种高新的技术为基因表达数据的搜集提供了便利,从一次实验获得大量的反应基因产物mRNA丰度的数据,通过微阵列技术得到的反应mRNA丰度的数据通常称为微阵列基因表达数据,简称微阵列。自上个世纪90年代以来微阵列技术逐步形成,对生物领域产生深远影响,它的出现使基因活性的检测成为可能,将微阵列技术应用病理诊断分析的实验便由此开始。此后,在经历了20多年的不断发展,将生物医学,计算机等领域将其融合。如今,微阵列技术不断完善,成为生物信息学中热门话题,为人类探索生物信息提供了新的篇章。由于微阵列的维数高,噪声大,及冗余性强等特性,这种特征给基因选择的实验带来了挑战;本文提出一种面向高维微阵列数据的混合特征算法,根据信噪比方法,Lasso方法,Filter方法及Wrapper方法混合优势对微阵列基因表达数据分析,提出混合Relief-PSO方法对数据分析研究。本文首先回顾微阵列数据分析的一些方法,然后介绍集成系统学习的方法。最后是关于新的集成技术在微阵列数据上的应用。主要工作如下:(1)微阵列算法的介绍,以及对于单独的信噪比方法,Lasso方法,Filter方法,Wrapper方法的特征在微阵列的应用。借于结合的信噪比和Lasso法、Filter法和Wrapper法混合。最后阐明本文的主要研究内容。(2)单个实验产生的微阵列数据难免会达不到理想状态,也会影响到数据学习训练分类器的效果和泛化能力,将多个实验的方法集成起来可以提高分类器泛化能力和实验数据的高效性,也更加接近基因表达数据的分析能力,在处理高维小样本、高冗余、高噪声的基因微阵列数据时,无法采用传统特征选择方法进行分析。本文针对该问题提出了一种结合Relief算法和粒子群优化算法(Relief-PSO)的混合特征选择方法,检测这种算法对数据的分类效果,产生泛化能力更好的集成算法。
[Abstract]:DNA microarray technology is a new technology developed by combining biology, microelectronics, computer science and radio and television chemistry, based on the original nucleic acid hybridization. In recent years, with the rapid development of large-scale high-throughput microarray technology, In one experiment, the expression level of tens of thousands of genes became a reality. This new technique facilitated the collection of gene expression data, and obtained a large amount of mRNA abundance data from one experiment. The mRNA abundance response data obtained by microarray technology is commonly called microarray gene expression data, or microarray. Since -10s, microarray technology has been gradually formed, which has a profound impact on the biological field. It made it possible to detect gene activity, and the experiment of applying microarray technology to pathological diagnosis and analysis began. Then, after more than 20 years of continuous development, it fused biomedical, computer, and other fields. Microarray technology has become a hot topic in bioinformatics, which provides a new chapter for human beings to explore bioinformatics. In this paper, a hybrid feature algorithm for high-dimensional microarray data is proposed to analyze the gene expression data of microarrays according to the mixed advantages of the signal-to-noise ratio (SNR) method, Lasso method, filter method and Wrapper method. A hybrid Relief-PSO method for data analysis is proposed. Firstly, some methods of microarray data analysis are reviewed. Finally, the application of new integration technology in microarray data is introduced. The main work is as follows: introduction of microarray algorithm. And the application of the characteristics of the Lasso / filter method / wrapper method to the microarray. By combining the SNR method with the Lasso filter method and the Wrapper method. Finally, the main research content of this paper is elucidated. 2) A single experimental production. The raw microarray data will inevitably fail to reach the desired state, It can also affect the effect and generalization ability of data learning training classifier. Integrating several experimental methods can improve the generalization ability of classifier and the efficiency of experimental data, and it is also closer to the analysis ability of gene expression data. When processing high-dimensional, small-sample, high-redundancy, high-noise gene microarray data, Traditional feature selection method can not be used to analyze this problem. A hybrid feature selection method combining Relief algorithm and particle swarm optimization (PSO) algorithm is proposed in this paper to detect the effect of this algorithm on data classification. A better integration algorithm with better generalization ability is generated.
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP18
【相似文献】
相关期刊论文 前6条
1 罗田;微阵列计划(MICROARRAY PROJECT,μAP)[J];生物工程进展;2001年03期
2 吴骋,王志勇,贺佳,贺宪民;SVMs在微阵列表达数据分析中的应用[J];数理统计与管理;2005年04期
3 刘国栋;DNA芯片技术及其农业应用[J];科技导报;2001年06期
4 宫改云,毛用才,高新波,刘三阳;基于模糊c-均值聚类的微阵列基因表达数据分析[J];西安电子科技大学学报;2004年02期
5 李非;伯晓晨;王升启;彭宇行;;一种具有高度可验证性的微阵列片间校准算法[J];计算机工程与科学;2010年08期
6 ;[J];;年期
相关会议论文 前7条
1 金玉霞;刘霞;葛加美;吴秀芳;宋勤浩;周赤燕;苗正友;;单核苷酸多态微阵列技术检测Williams-Beuren综合征微缺失[A];第九届全国遗传病诊断与产前诊断学术交流会暨产前诊断和医学遗传学新技术研讨会论文集[C];2014年
2 周大文;管翌华;许淼;颜景斌;陈美珏;黄英;任兆瑞;;MLPA-微阵列技术在性染色体异常检测中的应用[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
3 孙迅;江明锋;李校;张义正;;用cDNA微阵列技术快速筛选粗毛栓菌的表达基因[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
4 洪萍;朱培元;;微阵列技术在输血医学中的应用及其研究进展[A];中国输血协会第四届输血大会论文集[C];2006年
5 张亮;程京;;cDNA微阵列技术中内标poly(A)+RNA的制备[A];中国生物工程学会第三次全国会员代表大会暨学术讨论会论文摘要集[C];2001年
6 管翌华;熊灿;许淼;任兆瑞;黄英;;应用MLPA-微阵列技术对环状13号染色体的微小缺失鉴定[A];第八次全国医学遗传学学术会议(中华医学会2009年医学遗传学年会)论文摘要汇编[C];2009年
7 关新元;;比较基因组杂交技及微阵列技术在肿瘤研究中的应用[A];第三届“分子核医学在肿瘤诊断与治疗中的应用与研究进展”全国肿瘤分子标志的研究与方法学进展学术交流会资料汇编[C];2006年
相关博士学位论文 前4条
1 程志强;小分子微阵列的动力学药物筛选技术[D];清华大学;2015年
2 邓晔;微阵列技术中生物信息的利用和挖掘[D];浙江大学;2007年
3 周涛;基于细胞微阵列筛选泛素—蛋白酶体通路底物的研究[D];中国人民解放军军事医学科学院;2007年
4 王明怡;微阵列数据挖掘技术的研究[D];浙江大学;2004年
相关硕士学位论文 前8条
1 董文娟;微阵列基因表达数据混合特征算法研究[D];沈阳工业大学;2017年
2 王涛;蛋白质微阵列载体表面修饰方法效果比较及其应用研究[D];天津医科大学;2011年
3 刘亭;微阵列制备及M.fulvus HW-1耐盐相关基因表达谱分析[D];山东大学;2007年
4 王成雄;基于统计分析的微阵列数据挖掘技术[D];电子科技大学;2006年
5 刘艳;微阵列图像自动分析方法的研究[D];中国医科大学;2009年
6 李小燕;食物过敏原可视化检测抗体微阵列的构建[D];中国海洋大学;2010年
7 孙显赫;微阵列数据处理平台的设计与实现[D];南方医科大学;2011年
8 马n,
本文编号:1573794
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1573794.html