基于自步学习和鲁棒估计的属性选择算法研究
发布时间:2022-01-12 16:16
信息化时代的高维大数据通常呈现高维,多样性的特点。由于这些数据在积累的过程没有经过选择,使得高维大数据存在大量的不相关,冗余的属性,而能有效表达数据功能的属性被隐藏其中。这不但会增加存储数据所需的空间,还会消耗大量的计算资源,特别是随着数据维度的增加达到某一个值时,反而会导致数据挖掘算法性能的下降。因此对高维数据进行维数约简对于解决目前高维数据面临的诸多问题具有重要意义。属性选择作为维数约简的一种有效方法,在可靠性和对结果的解释性上都好于子空间学习方法,但子空间学习可用于探索数据的内部结构。所以本文结合这两种方法,从自步学习和鲁棒估计的角度,针对目前的属性选择算法未能充分考虑噪声和异常值影响以及忽略实现世界中的数据大多存在的流行结构从而导致的数据挖掘算法性能不佳等问题,提出了两种属性选择算法。具体如下:(1)针对现有属性选择模型没有充分考虑离群训练样本的影响而导致模型泛化能力差问题,提出一种结合自步学习和稀疏学习的有监督属性选择算法。具体地,首先通过自步学习理论优先选择高置信度的样本来训练初始属性选择模型,然后依次加入次高置信度的训练样本增加初始选择模型的泛化能力,直至增加的训练样本使...
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:50 页
【学位级别】:硕士
【部分图文】:
多分类结果
参数敏感图
German Statlog Vehicle图 4-3 收敛图4.4 小结本章提出了一种新的鲁棒图降维方法。该方法通过两种策略消除了原始数据中噪声和异常值的影响。具体的,反向图嵌入策略使得变换矩阵在原始数据的低维属性空间构造,而鲁棒估计器避免了异常值影响所涉及的三个矩阵(如反向图嵌入矩阵、变换矩阵和图矩阵)的学习。实验结果证明了该方法对两类分类和多分类任务的有效性和鲁棒性。
【参考文献】:
期刊论文
[1]基于自步学习多元回归分析[J]. 甘江璋,钟智,余浩,雷聪,赵树之. 计算机工程与设计. 2018(12)
本文编号:3585081
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:50 页
【学位级别】:硕士
【部分图文】:
多分类结果
参数敏感图
German Statlog Vehicle图 4-3 收敛图4.4 小结本章提出了一种新的鲁棒图降维方法。该方法通过两种策略消除了原始数据中噪声和异常值的影响。具体的,反向图嵌入策略使得变换矩阵在原始数据的低维属性空间构造,而鲁棒估计器避免了异常值影响所涉及的三个矩阵(如反向图嵌入矩阵、变换矩阵和图矩阵)的学习。实验结果证明了该方法对两类分类和多分类任务的有效性和鲁棒性。
【参考文献】:
期刊论文
[1]基于自步学习多元回归分析[J]. 甘江璋,钟智,余浩,雷聪,赵树之. 计算机工程与设计. 2018(12)
本文编号:3585081
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3585081.html