针对流特征的动态特征选择算法研究
发布时间:2021-03-16 10:41
大数据的高速发展,使特征选择技术面临着新的数据类型的挑战,类型之一的是流特征。流特征是指数据的样本空间固定不变,特征空间随时间而增大,特征逐个流入特征空间的场景,其难点在于流特征所在的高维数据空间呈现动态性,即特征空间不是或不能事先给定,而是随时间动态变化,因而特征空间呈未知性和演化性。尽管目前已经有许多针对流特征的特征选择算法的出现,但它们仍然存在着些许不足和缺点。首先,针对目前的流特征选择算法一旦认定特征是冗余的,则会剔除该特征,忽略了在流特征背景下被删除的冗余特征仍然可能对任务性能提升起到作用这一现象。本文提出了一种基于一个大小固定的缓冲池的在线流特征选择算法。缓冲池技术已广泛应用于流样本领域,本文将此应用在流特征上以解决上述问题。具体而言,算法通过缓冲池动态地保留和恢复特征来处理变化的特征空间,并结合了两种不同类型的特征选择器以提高预测表现的同时压缩特征空间。最终,将本文提出了的算法在12个典型的特征选择数据集上与现有流特征选择对比,表明了该算法能够获得更加优异的分类精度和空间压缩率。其次,Grafting算法是基于稀疏正则化约束的流特征选择经典算法。针对Grafting的诸多...
【文章来源】:南京理工大学江苏省 211工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
UCI机器学习仓库中近30年的数据样本和维度增长趋势图
特征按相关性划分从特征与类别和特征相互之间的相关性角度,可以将特征划分为无关特征,弱相关[8]
监督特征选择基本框架
【参考文献】:
期刊论文
[1]基于?2,1范数的在线流特征选择算法[J]. 吴中华,郑玮. 计算机与数字工程. 2019(06)
博士论文
[1]流特征下的在线知识发现研究[D]. 俞奎.合肥工业大学 2013
本文编号:3085914
【文章来源】:南京理工大学江苏省 211工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
UCI机器学习仓库中近30年的数据样本和维度增长趋势图
特征按相关性划分从特征与类别和特征相互之间的相关性角度,可以将特征划分为无关特征,弱相关[8]
监督特征选择基本框架
【参考文献】:
期刊论文
[1]基于?2,1范数的在线流特征选择算法[J]. 吴中华,郑玮. 计算机与数字工程. 2019(06)
博士论文
[1]流特征下的在线知识发现研究[D]. 俞奎.合肥工业大学 2013
本文编号:3085914
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3085914.html