基于遗传算法和加权极限学习机结合的乳腺癌亚型分类和基因选择
[Abstract]:There are various ways to solve the problem of gene selection for breast cancer subtypes. In this paper, a packaging method is used to find the gene sets most closely related to the classification of breast cancer subtypes in the potential selection of characteristic gene set space. There are two problems: first, how to evaluate a gene set good or bad. Second, in what way to find the best set of genes. For the first problem, the solution of this paper is to use the gene data training model in the gene set. If the prediction accuracy of the model for breast cancer subtype classification is high, the data used by the model are good. This means that the gene set is better. The model chosen in this paper is the ultimate learning machine, because it is a new neural network model algorithm, and it has the characteristics of simplicity and extreme speed, which is very suitable for extensive and repeated training. For the second problem, there are many search optimization methods for us to use, such as random search, exhaustive, ant colony algorithm and so on. Genetic algorithm is used in this paper. Its good robustness and relatively simple maneuverability are the main reasons why we choose genetic algorithm. Through the combination of genetic algorithm and extreme learning machine, we have selected a set of 50 genes, which has the most important correlation to the classification of breast cancer subtype. At the same time, we also use other feature selection method-filter method. By analyzing the redundancy of gene set, SAM method and greedy algorithm based on similarity measure are used to filter out a large number of redundant genes, which reduces the search space and avoids the interference of many useless genes to the algorithm. We call this process genetic pre-screening. After that, for the problem and data, the genetic operation and various parameter settings for solving the problem in this paper are given. In the study of the problem, we encounter the imbalance of genetic data. Through analysis and research, we use a weighted extreme learning machine, and solve this problem in a cost-sensitive way. Finally, the results of our method are compared with other methods. First, we compare the prediction performance of different machine learning algorithms on our optimal gene set, which shows that our selected gene set is robust. It has more than 95% geometric average accuracy prediction performance for different learning algorithms. Then we compared the predictive performance of the gene sets screened by our method with those obtained by other methods. The prediction accuracy of our method is 96.53%, which is better than that of any other method. It is proved that our method is worth studying and extending.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R737.9;TP18
【相似文献】
相关期刊论文 前10条
1 刘雅琴,王成,章鲁;基于多代竞争遗传算法的数值函数优化[J];上海第二医科大学学报;2005年08期
2 江金龙;朱亚军;薛云灿;;基于变区域搜索的改进遗传算法研究[J];九江学院学报(自然科学版);2006年03期
3 林中营;虞科;程翼宇;沈朋;;遗传算法优化尿样核苷毛细管电泳分析条件[J];药物分析杂志;2007年03期
4 曹明勇;陈超敏;周凌宏;童蕾;;双种群遗传算法优化射野方向及权重的研究[J];医疗卫生装备;2008年10期
5 蒋兴波;许开云;吴耀民;;卫勤最短回路问题的遗传算法求解[J];解放军医院管理杂志;2010年03期
6 周琴;孔玉;;基于遗传算法的医用溶液测定[J];医疗卫生装备;2011年04期
7 刘继清;;遗传算法在装备供应优化问题中的应用[J];江汉大学学报(自然科学版);2011年04期
8 乔树清;;改进后的遗传算法在排课系统中的应用研究[J];齐齐哈尔医学院学报;2007年16期
9 邢大地;吴效明;;基于改进的遗传算法求解脑电逆问题[J];中国组织工程研究与临床康复;2009年17期
10 杜海舰;伍瑞昌;王运斗;;基于遗传算法的带有软时间窗的卫生车辆调度优化研究[J];数理医药学杂志;2011年05期
相关会议论文 前10条
1 陈家照;廖海涛;张中位;罗寅生;;一种改进的遗传算法及其在路径规划中的应用[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
2 李国云;刘颖;薛梅;邬志敏;;遗传算法在高温空冷冷凝器优化设计中的应用[A];第五届全国制冷空调新技术研讨会论文集[C];2008年
3 王志军;李守春;张爽;;改进的遗传算法在反演问题中的应用[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年
4 任燕翔;姜立;刘连民;从滋庆;;改进遗传算法在三维日照方案优化中的应用[A];工程三维模型与虚拟现实表现——第二届工程建设计算机应用创新论坛论文集[C];2009年
5 韩娟;;遗传算法概述[A];第三届河南省汽车工程科技学术研讨会论文集[C];2006年
6 庞国仲;王元西;;基于遗传算法控制步长的定性仿真方法[A];'2000系统仿真技术及其应用学术交流会论文集[C];2000年
7 张忠华;杨淑莹;;基于遗传算法的聚类设计[A];全国第二届信号处理与应用学术会议专刊[C];2008年
8 何翠红;区益善;;遗传算法及其在计算机编程中的应用[A];1995年中国智能自动化学术会议暨智能自动化专业委员会成立大会论文集(下册)[C];1995年
9 靳开岩;张乃尧;;几种实用遗传算法及其比较[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
10 王宏刚;曾建潮;李志宏;;摄动遗传算法[A];1996年中国智能自动化学术会议论文集(下册)[C];1996年
相关重要报纸文章 前1条
1 林京;《神经网络和遗传算法在水科学领域的应用》将面市[N];中国水利报;2002年
相关博士学位论文 前10条
1 Amjad Mahmood;半监督进化集成及其在网络视频分类中的应用[D];西南交通大学;2015年
2 李险峰;基于改进遗传算法的汽车装配生产线平衡问题研究[D];北京科技大学;2017年
3 周辉仁;递阶遗传算法理论及其应用研究[D];天津大学;2008年
4 郝国生;交互式遗传算法中用户的认知规律及其应用[D];中国矿业大学;2009年
5 侯格贤;遗传算法及其在跟踪系统中的应用研究[D];西安电子科技大学;1998年
6 马国田;遗传算法及其在电磁工程中的应用[D];西安电子科技大学;1998年
7 唐文艳;结构优化中的遗传算法研究和应用[D];大连理工大学;2002年
8 周激流;遗传算法理论及其在水问题中应用的研究[D];四川大学;2000年
9 刘冀成;基于改进遗传算法的生物电磁成像与磁场聚焦应用研究[D];四川大学;2005年
10 袁丽华;基于物种进化的遗传算法研究[D];南京航空航天大学;2009年
相关硕士学位论文 前10条
1 张英俐;基于遗传算法的作曲系统研究[D];山东师范大学;2006年
2 钟海萍;原对偶遗传算法与蚁群算法的一种融合算法[D];暨南大学;2013年
3 李志添;模糊遗传算法与资源优化配置的预测控制[D];华南理工大学;2015年
4 王琳琳;新型双层液压轿运车车厢的设计研究[D];上海工程技术大学;2015年
5 李海全;基于遗传算法的建筑体形系数及迎风面积比优化方法研究[D];华南理工大学;2015年
6 彭骞;基于遗传算法的山区高等级公路纵断面智能优化方法研究[D];昆明理工大学;2015年
7 周玉林;基于小波分析和遗传算法的配电网故障检测[D];昆明理工大学;2015年
8 郭颂;基于粗糙集和遗传算法的数字管道生产管理系统研究[D];昆明理工大学;2015年
9 吴南;数值逼近遗传算法的研究应用[D];华南理工大学;2015年
10 于光帅;一类优化算法的改进研究与应用[D];渤海大学;2015年
,本文编号:2131664
本文链接:https://www.wllwen.com/yixuelunwen/zlx/2131664.html