面向特征选择问题的协同演化方法
【图文】:
以防止陷入局部最优,又提升了演化速度。1基础知识1.1特征选择数据集D中含有k个样本D={x1,x2,…,xk},并且D中的每个样本都有特征集合F,F包含n维特征,xi∈Rn。对于分类问题,可将D中样本划分为目标向量C中的m个不同的类C={C1,C2,…,Cm}。特征选择的目的,是在原始特征集合N中寻找到一个最佳特征子集P,其中含有p维特征(p<n),,在该特征子集下能最大化分类任务(或其他学习任务)的预测正确率。特征选择处理包括4个组件:特征子集生成、子集评估、终止条件和结果验证。如图1所示,在阶段1中根据一个确定的搜索策略特征子集生成组件会预先产生候选特征子集。每一个候选特征子集都会被一个确定的评估方式所度量,并与之前最佳的候选特征子集做比较,如果新的特征子集表现得更加优越,那么替换原有的最佳特征子集。当满足设定的终止条件时,生成和评估这两个过程将不再循环。在阶段2中,最终所选的特征子集需要被一些给定的学习算法进行结果验证,其中ACC为学习正确率[3]。图1特征选择处理的统一视角Fig.1Aunifiedviewoffeatureselectionprocess1.2遗传算法基本原理遗传算法作为一种自适应全局优化搜索算法,其选择、交叉与变异的3个算子成为种群寻优和保持解多样性的关键。其基本执行过程如下。1)初始化:确定种群规模N、交叉概率Pcross、变异概率Pmutation和终止进化准则。2)个体评价:计算每个个体的适应度。3)种群进化:①选择算子:个体被选中的概率与其适应度函数值成正比。②交叉算子:根据交叉概率Pcross对2条染色体交换部分基因,构造下一代新的染色体。③变异算子:根据概率Pmutation对群体中的不同个体指定的基因位进行改造。④终止检验:如已?
,利用该函数将连续的速度值转化为离散的位置。在最初的研究中使用式(3)中的sigmoid函数作为转换函数将实值的速度映射为[0,1]之间的值。Tvkh((t))=11+e-vkh(t)(3)式中:vkh(t)为粒子h在第t轮迭代中第k维的速度。在将粒子速度转换为概率值后,位置向量将依据概率值进行更新:xkh(t+1)=0,rand<Tvkh((t+1))1,rand≥Tvkh((t+1)){(4)2求解特征子集的协同演化方法2.1编码方式本文使用了二进制比特串的编码方式,该编码方式通用于遗传算法和二元粒子群方法,如图2所示。将每个二进制串作为一个个体(粒子),个体(粒子)中的每一维(每一比特)都代表一个候选特征,当该位为1时表示该特征被选中,并添加到候选的特征子集中;当该位为0时表示该特征未被选中。依据此编码方式将特征选择问题转换为寻找最佳个体(粒子)的问题。图2二元粒子群的编码方式Fig.2CodingschemeofBPSO2.2适应度函数本文使用互信息熵理论对特征子集进行整体评估,两个变量的互信息值越大,则意味着两个变量相关程度越紧密;当互信息为零时,则意味着两个变量完全不相关。特征集合F={f1,f2,…,fn}中某一特征fi与类别的互信息度量如下:I(fi,C)=H(fi)+H(C)-H(fi,C)(5)式中:H为变量的熵值,用以度量随机变量信息的不确定性。以类别向量为例,H(C)通常用作描述离散随机变量C={c1,c2,…,cn}熵值,ci是变量C的可能取值,p(ci)为概率密度函数。H(C)=-∑mi=1p(ci)log(p(ci))(6)当已知特征变量和类别变量fi和C的联合概率密度时(对于离散数据意味着两个变量对应的属性值联合出现的频度),两者的联合熵为Hfi(,C)=-∑
【相似文献】
相关期刊论文 前10条
1 滕旭阳;董红斌;孙静;;面向特征选择问题的协同演化方法[J];智能系统学报;2017年01期
2 任江涛;黄焕宇;孙婧昊;印鉴;;基于遗传算法及聚类的基因表达数据特征选择[J];计算机科学;2006年09期
3 曾孝平;李勇明;王靖;张晓娟;郑雅敏;;基于竞争策略的链式智能体遗传算法用于特征选择的研究[J];系统仿真学报;2008年08期
4 曾孝平;王靖;李勇明;郑雅敏;张晓娟;;用于特征选择的多准则闭合链式遗传算法[J];数据采集与处理;2008年04期
5 任斌,丰镇平;改进遗传算法与粒子群优化算法及其对比分析[J];南京师范大学学报(工程技术版);2002年02期
6 唐凤;宣士斌;范晓杰;;基于遗传算法的关节特征选择[J];广西民族大学学报(自然科学版);2017年01期
7 解英杰;朱振方;;一种基于模糊遗传算法的最优特征子集优化方法研究[J];信息技术与信息化;2008年06期
8 任江涛;孙婧昊;黄焕宇;印鉴;;一种基于信息增益及遗传算法的特征选择算法[J];计算机科学;2006年10期
9 黄菊;;基于遗传算法的产品基因重组设计[J];电脑与电信;2016年12期
10 张子宁;单甘霖;段修生;张岐龙;;基于改进遗传算法的支持向量机特征选择[J];电子产品世界;2010年Z1期
相关会议论文 前10条
1 易超群;李建平;朱成文;;一种改进的浮动搜索特征子集算法[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
2 杨雅伟;侍洪波;;量子粒子群优化算法及其应用研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
3 廖勇;王飞;;基于混合改进遗传算法的非线性规划问题研究[A];第四届中国智能计算大会论文集[C];2010年
4 彭军;徐本柱;刘晓平;;遗传算法的实现及其在生产调度中的应用[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
5 陈猛;;遗传算法在机械设计中的研究和创新[A];2017年9月全国教育科学学术科研成果汇编[C];2017年
6 赖梅;熊丽荣;;基于改进遗传算法的乘务交路优化问题研究[A];第二十一届中国控制会议论文集[C];2002年
7 肖龙光;丁晓东;;基于理性变异的遗传算法[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
8 肖龙光;丁晓东;谢集平;;粒子群优化算法的改进[A];第二十三届中国控制会议论文集(上册)[C];2004年
9 鞠训光;于洪珍;;求整体优化全部解的区间排除遗传算法[A];第十七届全国过路控制会议论文集[C];2006年
10 刘兴隆;;快速进化式遗传算法[A];“电力大系统灾变防治和经济运行重大课题”部分专题暨第九届全国电工数学学术年会论文集[C];2003年
相关重要报纸文章 前1条
1 上海科学院规划研究处 刘小玲;上海能否成为人工智能城市[N];解放日报;2017年
相关博士学位论文 前10条
1 滕旭阳;面向特征选择问题的优化方法研究[D];哈尔滨工程大学;2017年
2 马国田;遗传算法及其在电磁工程中的应用[D];西安电子科技大学;1998年
3 孙秋红;基于遗传算法的水质数据挖掘与应用研究[D];燕山大学;2016年
4 宋晓峰;优生演进优化和统计学习建模[D];浙江大学;2003年
5 李智勇;模式交流多群体遗传算法及其在神经网络进化建模中的应用[D];湖南大学;2003年
6 田明俊;智能反演算法及其应用研究[D];大连理工大学;2006年
7 王微微;气液两相流参数检测新方法研究[D];浙江大学;2006年
8 温步瀛;发电机组启停机计划的智能优化研究[D];福州大学;2006年
9 葛培明;改进的遗传算法及其在工程优化中的应用[D];西南交通大学;2006年
10 潘伟;基于遗传算法的鲁棒控制问题研究[D];东北大学;2006年
相关硕士学位论文 前10条
1 王靖;基于基因锁定及链式智能体遗传算法的特征选择研究[D];重庆大学;2008年
2 郑雅敏;基于遗传算法的特征选择方法的改进研究[D];重庆大学;2008年
3 冯茂;基于粒子群优化的网络视频流特征选择与识别[D];南京邮电大学;2017年
4 曹彦;基于支持向量机的特征选择及其集成方法的研究[D];郑州大学;2010年
5 杜政霖;在线特征选择及其应用[D];南京邮电大学;2017年
6 吴冠朋;基于智能计算的HBV病毒再激活分类预测模型研究[D];齐鲁工业大学;2017年
7 付志军;遗传算法和粒子群优化算法在车间作业调度问题中的应用[D];吉林大学;2014年
8 江中央;正交遗传算法及其应用研究[D];中南大学;2008年
9 吴佳英;多亲遗传算法及其应用研究[D];湘潭大学;2003年
10 朱合兴;基于蒙特卡罗树搜索的预测状态表示模型获取及特征选择研究[D];厦门大学;2017年
本文编号:2556648
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2556648.html