基于特征级图学习的无监督特征选择算法研究

发布时间:2021-11-21 04:01
  数据表示是机器学习、数据挖掘和模式识别等领域共性的基础问题之一。随着数据采集等相关技术的快速发展,许多实际应用场景中普遍存在着高维大数据。同时,数据采集过程中不可避免的会引入部分低质量的特征比如噪声数据和异常特征等。这些高维数据一方面通过采用更高维度的特征使得对数据内在结构的刻画能力得到增强,另一方面也引入更高的数据存储计算成本并且给机器学习等相关算法的学习提出了更高的挑战。研究人员近年来提出多种方法处理高维数据,其中代表性技术包括数据降维和特征选择。特征选择技术根据是否依赖数据真实标签大致分为有监督、半监督和无监督三类。无监督特征选择方法在进行特征选择时不依赖真实数据标签,因此有着较为广阔的应用前景并对算法提出更高的挑战。近年来研究人员提出大量的无监督特征选择算法其中主要包括过滤式和嵌入式等两大类方法。一般来说,过滤式方法超参数较少,算法实现较为简单,性能较为有限;而嵌入式方法通常涉及较多的超参数,算法过程相对复杂,经过仔细调参后性能较高。尽管无监督特征选择领域近年来已经提出了多种方法,但是这些算法依然存在一些缺点:(1)现有算法普遍采用基于向量的表示进行特征选择。当数据存在低质量特... 

【文章来源】:山西大学山西省

【文章页数】:74 页

【学位级别】:硕士

【文章目录】:
中文摘要
ABSTRACT
绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
    1.3 主要研究内容
    1.4 论文组织结构
第二章 相关工作
    2.1 特征选择概述
        2.1.1 特征选择过程
        2.1.2 搜索策略
        2.1.3 评价标准
    2.2 特征选择算法分类
    2.3 无监督特征选择算法分类
        2.3.1 过滤式无监督特征选择算法
        2.3.2 嵌入式无监督特征选择算法
    2.4 本章小结
第三章 特征级LLE构图的过滤式无监督特征选择算法
    3.1 LLE算法
    3.2 提出的算法
    3.3 实验结果与分析
        3.3.1 对比方法
        3.3.2 数据集选择
        3.3.3 参数设置
        3.3.4 聚类结果分析
        3.3.5 参数敏感性分析
    3.4 本章小结
第四章 特征级邻近图重建的嵌入式无监督特征选择算法
    4.1 算法模型
    4.2 实验结果与分析
        4.2.1 对比方法
        4.2.2 数据集选择
        4.2.3 参数设置
        4.2.4 聚类结果分析
        4.2.5 特征冗余性分析
    4.3 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
个人简况及联系方式



本文编号:3508732

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3508732.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户74d3d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com