基于遗传算法与支持向量机的癌症特征基因提取
发布时间:2022-01-01 23:47
针对癌症基因特征提取问题,根据遗传算法中不同迭代时期的种群特性,设计了新的突变方法。多突变基因库与种群代数相关的设计,使得算法能够较快地收敛到最优解而又避免其过早陷入局部最优解中;选择算子中包括个体对种群的基因丰富度贡献;针对种群中大量的重复个体,加入重复控制,去除重复个体,提高个体与种群基因的多样性。算法在几种实验数据集上均取得了较好的结果。
【文章来源】:电脑知识与技术. 2020,16(26)
【文章页数】:4 页
【部分图文】:
染色体编码
采用中点交叉互换法,如图2所示,从种群中随机选出两个个体,以解的中点为界,交叉互换两个解的一部分。本算法中交叉互换率设置为0.7,本算法在此步添加了重复控制,当chromosome中包含重复基因时,此次交叉互换失效,重新进行。2.3.3 变异算子
采用单基因突变,如图3所示,随机选取解的一个基因进行突变,本算法在突变的过程中添加了重复控制,突变时进行检查,如果突变基因在原来的解中,则需要重新进行突变,这一步和交叉互换中的重复控制保证了所有的染色体符合解约束(特征子集数),突变率设置为0.3。本算法设计了一个基于最大信息系数(MIC)打分,并与种群代数相关的突变方法进行突变基因的选择。MIC又称最大相互信息系数,是基于信息的非参数性方法,用于衡量两个变量之间的线性或非线性的强度。本算法先利用MIC计算基因与类别的相关性,并将相关性作为基因的分数。
【参考文献】:
期刊论文
[1]高维小样本分类问题中特征选择研究综述[J]. 王翔,胡学钢. 计算机应用. 2017(09)
[2]基于K折交叉验证的选择性集成分类算法[J]. 胡局新,张功杰. 科技通报. 2013(12)
[3]基于过采样技术和随机森林的不平衡微阵列数据分类方法研究[J]. 于化龙,高尚,赵靖,秦斌. 计算机科学. 2012(05)
[4]不平衡类数据挖掘研究综述[J]. 翟云,杨炳儒,曲武. 计算机科学. 2010(10)
[5]基于filter-wrapper的两步特征变量提取方法[J]. 陈岩,来海锋,王清,王卫伟. 机电工程. 2010(04)
硕士论文
[1]基因表达谱数据特征选择与提取方法研究[D]. 刘金勇.中国计量学院 2014
本文编号:3563059
【文章来源】:电脑知识与技术. 2020,16(26)
【文章页数】:4 页
【部分图文】:
染色体编码
采用中点交叉互换法,如图2所示,从种群中随机选出两个个体,以解的中点为界,交叉互换两个解的一部分。本算法中交叉互换率设置为0.7,本算法在此步添加了重复控制,当chromosome中包含重复基因时,此次交叉互换失效,重新进行。2.3.3 变异算子
采用单基因突变,如图3所示,随机选取解的一个基因进行突变,本算法在突变的过程中添加了重复控制,突变时进行检查,如果突变基因在原来的解中,则需要重新进行突变,这一步和交叉互换中的重复控制保证了所有的染色体符合解约束(特征子集数),突变率设置为0.3。本算法设计了一个基于最大信息系数(MIC)打分,并与种群代数相关的突变方法进行突变基因的选择。MIC又称最大相互信息系数,是基于信息的非参数性方法,用于衡量两个变量之间的线性或非线性的强度。本算法先利用MIC计算基因与类别的相关性,并将相关性作为基因的分数。
【参考文献】:
期刊论文
[1]高维小样本分类问题中特征选择研究综述[J]. 王翔,胡学钢. 计算机应用. 2017(09)
[2]基于K折交叉验证的选择性集成分类算法[J]. 胡局新,张功杰. 科技通报. 2013(12)
[3]基于过采样技术和随机森林的不平衡微阵列数据分类方法研究[J]. 于化龙,高尚,赵靖,秦斌. 计算机科学. 2012(05)
[4]不平衡类数据挖掘研究综述[J]. 翟云,杨炳儒,曲武. 计算机科学. 2010(10)
[5]基于filter-wrapper的两步特征变量提取方法[J]. 陈岩,来海锋,王清,王卫伟. 机电工程. 2010(04)
硕士论文
[1]基因表达谱数据特征选择与提取方法研究[D]. 刘金勇.中国计量学院 2014
本文编号:3563059
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3563059.html
最近更新
教材专著