基于归一化模糊联合互信息最大的特征选择
本文关键词:基于归一化模糊联合互信息最大的特征选择 出处:《计算机工程与应用》2017年22期 论文类型:期刊论文
更多相关文章: 模糊等价关系 联合互信息 最大最小准则 特征选择
【摘要】:特征选择就是从特征集合中选择出与分类类别相关性强而特征之间冗余性最小的特征子集,这样一方面可以提高分类器的计算效率,另一方面可以提高分类器的泛化能力,进而提高分类精度。基于互信息的特征相关性和冗余性的评价准则,在实际应用中存在以下的问题:(1)变量的概率计算困难,进而影响特征的信息熵计算困难;(2)互信息倾向于选择值较多的特征;(3)基于累积加和的候选特征与特征子集之间冗余性度量准则在特征维数较高的情况下容易失效。为了解决上述问题,提出了基于归一化模糊互信息最大的特征评价准则,基于模糊等价关系计算变量的信息熵、条件熵、联合熵;利用联合互信息最大替换累积加和的度量方法;基于归一化联合互信息对特征重要性进行评价;基于该准则建立了基于前向贪婪搜索的特征选择算法。在UCI机器学习标准数据集上的多组实验,证明算法能够有效地选择出对分类类别有效的特征子集,能够明显提高分类精度。
[Abstract]:Feature selection is to select the feature subset which has strong correlation with the classification category and the least redundancy between the features from the feature set. On the one hand, it can improve the computing efficiency of the classifier. On the other hand, it can improve the generalization ability of classifier, and then improve the classification accuracy. In the practical application, there are the following problems: 1) the probability of the variable is difficult to calculate, and then the information entropy which affects the feature is difficult to calculate. (2) Mutual information tends to select features with more values; In order to solve the above problem, redundancy metrics between candidate features and feature subsets based on cumulative sum are easy to fail in the case of high feature dimension. Based on the normalized fuzzy mutual information maximum feature evaluation criterion, the information entropy, conditional entropy and joint entropy of variables are calculated based on fuzzy equivalence relation. A measure of the cumulative sum of the maximum substitution of joint mutual information; The importance of feature is evaluated based on normalized joint mutual information. Based on this criterion, a feature selection algorithm based on forward greedy search is established. Experiments on UCI machine learning standard data set show that the algorithm can effectively select feature subsets that are effective for classification categories. The classification accuracy can be improved obviously.
【作者单位】: 武汉科技大学城市学院实验实训中心;华中科技大学软件学院;
【基金】:国家自然科学基金(No.61472289) 中央高校基本科研业务费专项资金(No.2015IVA067) 河南省教育厅自然科学基金(No.15A110011)
【分类号】:TP18
【正文快照】: 1.武汉科技大学城市学院实验实训中心,武汉4300832.华中科技大学软件学院,武汉4300001.Research and Training Center of City College,Wuhan University of Science and Technology,Wuhan 430083,China2.School of Software Engineering,Huazhong University of ScienceTech
【相似文献】
相关期刊论文 前10条
1 李云;;稳定的特征选择研究[J];微型机与应用;2012年15期
2 钱学双;多重筛选逐步回归特征选择法及其应用[J];信息与控制;1986年05期
3 王新峰;邱静;刘冠军;;基于特征相关性和冗余性分析的机械故障特征选择研究[J];中国机械工程;2006年04期
4 张葛祥;金炜东;胡来招;;满意特征选择及其应用[J];控制理论与应用;2006年01期
5 蒋盛益;王连喜;;基于特征相关性的特征选择[J];计算机工程与应用;2010年20期
6 张禹;刘云东;;基于相容粒的特征选择[J];宿州学院学报;2011年02期
7 付涛;;基于特征选择的多示例学习算法研究[J];科技通报;2013年08期
8 李丽娜;欧阳继红;刘大有;高文杰;;一种结合特征选择和链接过滤的主动协作分类方法[J];计算机研究与发展;2013年11期
9 桑农;谢衍涛;高如新;张天序;;神经模糊网络特征选择[J];模式识别与人工智能;2006年06期
10 曹彦;王倩;周驰;;基于特征选择技术的集成方法研究[J];计算机工程与科学;2013年08期
相关博士学位论文 前5条
1 代琨;基于支持向量机的网络数据特征选择技术研究[D];解放军信息工程大学;2013年
2 杨峻山;生物组学数据的集成特征选择研究[D];深圳大学;2017年
3 刘波;组稀疏子空间的大间隔特征选择[D];重庆大学;2013年
4 王瑞;针对类别不平衡和代价敏感分类问题的特征选择和分类算法[D];中国科学技术大学;2013年
5 姚兰;支持向量机特征选择中的L_p正则化方法研究[D];湖南大学;2014年
相关硕士学位论文 前10条
1 周瑞;基于支持向量机特征选择的移动通信网络问题分析[D];华南理工大学;2015年
2 季金胜;高分辨率遥感影像典型地物目标的特征选择及其稳定性研究[D];上海交通大学;2015年
3 王维智;基于特征提取和特征选择的级联深度学习模型研究[D];哈尔滨工业大学;2015年
4 兰天;CUDA平台下基于分层多组粒子群算法的特征选择研究[D];重庆大学;2015年
5 徐冬;基于特征选择的入侵检测方法研究[D];吉林大学;2016年
6 肖丽莎;半监督特征选择关键技术研究[D];西南交通大学;2016年
7 李昌;概率特征选择分类向量机[D];中国科学技术大学;2016年
8 谭蕴琨;面向稀疏数据的在线学习特征选择方法研究[D];华南理工大学;2016年
9 蔡亚萍;结合标记相关性的多标记特征选择及分类算法研究[D];南京师范大学;2016年
10 陈东方;复杂数据分类方法及其应用研究[D];天津大学;2014年
,本文编号:1418218
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1418218.html