基于SAL框架的特征选择算法
发布时间:2021-06-13 03:42
特征选择作为组合优化问题在数据挖掘方面是一个很重要的数据预处理步骤,即通过移除不相关和冗余的特征来提高学习算法的性能。在现实机器学习过程中,用户获得原始数据之后先进行特征选择预处理,用选择后的特征子集再训练学习器。特征选择之所以重要一是因为在现实任务中获得到的数据都是高维特征,经常遇到维数灾难,若能从中选择出有价值的特征,使得后续的学习阶段仅需在一部分特征上建立模型即可,那么维数灾难问题就可以得到一部分缓解;另一个原因是移除不相关和冗余的特征会降低后续的学习难度。演化算法是许多目前比较流行的解决特征选择问题的首要选择(比如森林优化算法,粒子群优化算法等),通过将演化算法离散化求解最优特征子集,FSFOA和POS(4-2)都是基于演化算法的特征选择算法。近年来一些研究表明,基于演化算法的特征选择算法比传统的机器学习特征选择算法要具有更好的泛化性能,目前的演化算法都遵循sampling-and-learning(SAL)这样的机制。Sampling-and-classification(SAC)是SAL的一个特定版本,在学习阶段将二元分类器作为一个模型,指导采样阶段的采样质量,计算开销大幅...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
熵随概率变化曲线
本文编号:3226920
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
熵随概率变化曲线
本文编号:3226920
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3226920.html