基于Lasso和互信息的特征选择算法研究

发布时间:2020-12-23 18:11
  随着计算机技术和网络技术的飞速发展,大数据和人工智能的浪潮也随之而来,数据越来越多,数据的特征也随之变得更加繁杂。当数据大量产生时,如何去处理这些数据就成了当下迫切需要解决的问题。在传统单标记方法无法满足现实需要的时候,多标记学习框架被提出,随着越来越多专家学者的深入研究,更多的基于多标记学习的研究方法相继被提出。特征选择在解决数据高维性问题具有很好的效果,在原始特征空间的基础上进行操作,去除冗余,得到一个性能优越的特征子集。有效的提高分类器的分类性能,减少运算时间,提高算法的计算效率。但是这些传统的特征选择算法却只能处理静态的特征数据,需要在运算前获取整个特征空间,然后才能加以处理得到相应的特征子集。而现实生活中,特征空间往往是动态产生的,并实时增加变化的,这就导致了传统的特征选择算法无法处理这类流特征选择问题。基于上述问题,本文提出了两种特征算法用以解决相应的特征选择问题,主要内容如下:(1)针对传统特征选择算法在删除冗余特征,进行特征子集的选择过程中,往往存在计算开销大的问题,本文引入了Lasso特征选择算法,用于快速处理高维数据,选择特征子集。此外鉴于传统的信息熵不具有补的性质... 

【文章来源】:安庆师范大学安徽省

【文章页数】:50 页

【学位级别】:硕士

【部分图文】:

基于Lasso和互信息的特征选择算法研究


特征选择流程图

基于Lasso和互信息的特征选择算法研究


使用Friendmantest

【参考文献】:
期刊论文
[1]基于邻域粗糙集的大规模层次分类在线流特征选择[J]. 白盛兴,林耀进,王晨曦,陈晟煜.  模式识别与人工智能. 2019(09)
[2]Artificial Intelligence & Machine Learning in the Earth Sciences[J]. Norman MacLEOD.  Acta Geologica Sinica(English Edition). 2019(S1)
[3]机器学习随机森林算法的应用现状[J]. 杭琦,杨敬辉.  电子技术与软件工程. 2018(24)
[4]一种利用局部标记相关性的多标记特征选择算法[J]. 蔡亚萍,杨明.  南京大学学报(自然科学). 2016(04)
[5]基于粗糙集的多标记专属特征学习算法[J]. 李华,李德玉,王素格,张晶.  小型微型计算机系统. 2015(12)
[6]基于邻域粗糙集的多标记分类特征选择算法[J]. 段洁,胡清华,张灵均,钱宇华,李德玉.  计算机研究与发展. 2015(01)
[7]基于迭代Lasso的肿瘤分类信息基因选择方法研究[J]. 张靖,胡学钢,李培培,张玉红.  模式识别与人工智能. 2014(01)
[8]特征选择方法综述[J]. 姚旭,王晓丹,张玉玺,权文.  控制与决策. 2012(02)
[9]多标记学习的嵌入式特征选择[J]. 葛雷,李国正,尤鸣宇.  南京大学学报(自然科学版). 2009(05)
[10]基于聚类和信息熵的特征选择算法[J]. 李霞,蒋盛益,郭艾侠.  郑州大学学报(理学版). 2009(01)

硕士论文
[1]面向代价敏感多标记数据的特征选择研究[D]. 黄琴.江西农业大学 2019
[2]基于互信息的多标签特征选择[D]. 张毅斌.西安工程大学 2019
[3]多标签分类中流特征选择算法研究[D]. 郭喜芝.南京师范大学 2018
[4]高维小样本数据的互信息特征选择方法研究[D]. 张凯.山西大学 2017
[5]特征选择与特征学习算法研究[D]. 周琪.中国科学技术大学 2017



本文编号:2934131

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2934131.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2548f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com