当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于数据结构学习和微粒群优化的无监督特征选择方法

发布时间:2020-11-19 15:11
   随着大数据时代的到来,生产生活中的高维数据越来越普遍。在保存更多有用信息的同时,高维数据也引入了很多不相关或冗余的属性(特征)。为了减少系统学习的时间、提高学习的精度,如何选出最具代表性的特征已成为机器学习的研究热点之一。相对有监督和半监督特征选择问题,因为没有标签信息进行指导,无监督特征选择变得非常困难。本文基于数据结构学习和微粒群优化等方法或技术,研究高效的无监督特征选择算法,主要包括以下三个内容:(1)首先,考虑数据的局部结构,将无监督特征选择问题转化为有监督特征选择问题,提出了一种基于非负拉普拉斯嵌入引导子空间学习的特征选择模型及求解算法。该方法利用非负拉普拉斯嵌入产生问题的伪标签,以保证数据的分类精度;有机融合数据的标签信息,建立了基于子空间学习的特征选择模型,以保持数据的局部结构;给出了模型的迭代求解算法,并证明了算法的收敛性;将所提算法用于脸部图像处理等典型数据集,实验结果证明了它的有效性。(2)其次,同时考虑数据的全局和局部结构,提出了一种融合结构学习的无监督特征选择模型及求解算法。该方法利用稀疏自表示和概率邻域关系图,分别学习原始数据的全局和局部流形结构;在进行结构学习的同时,通过引入行稀疏特征变换矩阵来选择特征,给出了融合结构学习的无监督特征选择模型;设计了结构学习和特征选择并进的迭代求解算法;将所提算法用于语音数据处理等典型数据集,实验结果证明了其优越性。(3)最后,有机融合微粒群优化的全局搜索能力和过滤式方法的局部开发能力,提出了一种两阶段混合无监督特征选择方法。第一阶段,利用信息熵评估特征之间的平均相关性,给出了基于最大熵原理的特征空间缩减策略,用以快速删除不相关的特征;第二阶段,利用一种改进的骨干微粒群优化算法,从缩减后的特征空间中搜索关键特征,用以产生高质量的特征子集。进一步,给出了一种基于特征冗余性的微粒局部搜索策略,改善微粒群的开发能力;在多个典型数据集上的实验结果,表明了所提算法的有效性和优越性。
【学位单位】:中国矿业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP18
【部分图文】:

特征子集,比例,算法,无监督


融合骨干微粒群优化和平均相关性的两阶段混合无监督特征选择了大量的不相关和冗余特征。其它 4 种特征选择方法进行比较,表 5-2 和表 5所有算法的分类精度结果。在表 5-2 和表 5-3 中类器所得分类结果,其它列为不同特征选择方法算法在不同数据集上的平均分类精度值。利用黑相应的特征选择方法。
【参考文献】

相关期刊论文 前10条

1 崔文岩;孟相如;李纪真;王明鸣;陈天平;王坤;;基于粗糙集粒子群支持向量机的特征选择方法[J];微电子学与计算机;2015年01期

2 王凌;沈婧楠;王圣尧;邓瑾;;协同进化算法研究进展[J];控制与决策;2015年02期

3 巩敦卫;胡滢;张勇;;基于多目标微粒群优化的异质数据特征选择[J];电子学报;2014年07期

4 谭台哲;叶青;尚鹏;;基于局部重构的无监督特征选择方法[J];计算机应用研究;2014年09期

5 何清;李宁;罗文娟;史忠植;;大数据下的机器学习算法综述[J];模式识别与人工智能;2014年04期

6 周志华;;基于分歧的半监督学习[J];自动化学报;2013年11期

7 范雪莉;冯海泓;原猛;;基于互信息的主成分分析特征选择算法[J];控制与决策;2013年06期

8 戴大蒙;慕德俊;;非完备信息系统的启发式特征选择遗传算法[J];电子学报;2013年03期

9 孟小峰;慈祥;;大数据管理:概念、技术与挑战[J];计算机研究与发展;2013年01期

10 李晓艳;张子刚;张逸石;张谧;;一种基于KL散度和类分离策略的特征选择算法[J];计算机科学;2012年12期



本文编号:2890149

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2890149.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5a7dc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com