基于邻域粗糙集的属性约简算法研究及应用
发布时间:2020-12-31 14:10
粗糙集理论是一种数据信息的处理工具,能帮助我们从海量数据中高效的挖掘、获取出我们所需要的信息,在许多领域都得到广泛应用。但是经典的粗糙集理论模型只适合处理离散型数据,而在用其处理连续型数据时,需要先对数据离散化,这样容易导致某些数据信息的丢失。为此邻域粗糙集模型通过引入了邻域粒化和度量空间的概念,将粗糙集理论的等价关系转化为邻域空间上对信息粒子的覆盖关系,可直接处理连续型数据,避免了原粗糙集处理连续属性带来的信息丢失问题,扩大模型的适用范围。同时,由于邻域粗糙集模型引入了邻域粒化的计算,导致整体算法效率下降。本文主要是在现有邻域粗糙集属性约简模型的基础上,针对发现的问题,对其进行改进,并通过实验加以验证。另外,本文将改进的算法应用到改进的C4.5决策树分类器模型中,对其进行深入研究。本文主要工作如下:(1)对现有邻域粗糙集属性约简算法进行分析,针对现有算法中通过依赖度函数判断属性重要度来进行属性约简时,存在重复冗余计算,导致算法复杂度高、计算量大。本文重新定义了属性重要度的求解方法,降低了算法计算的复杂性。同时,为了减少属性间的相关性对最终结果的影响,引入相关系数的有关知识,进一步筛检...
【文章来源】:青岛大学山东省
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 选题背景及意义
1.2 国内外研究现状
1.3 本文的主要内容和组织结构
第二章 粗糙集理论基础
2.1 经典粗糙集理论基础
2.2 邻域粗糙集理论基础
2.3 本章小结
第三章 基于邻域粗糙集的属性约简算法
3.1 前向贪心数值属性约简算法
3.2 前向搜索属性约简快速算法
3.3 基于邻域粗糙集的快速属性约简算法
3.4 本章小结
第四章 基于邻域粗糙集属性重要度的快速约简算法
4.1 基于K近邻属性重要度和相关系数的属性约简算法
4.1.1 K近邻属性重要度
4.1.2 相关系数及其性质
4.1.3 算法设计与实现
4.1.4 实验分析
4.2 基于Relief的快速属性约简算法
4.2.1 基于Relief的属性重要度算法
4.2.2 基于Relief的快速属性约简算法
4.2.3 实验分析
4.3 本章小结
第五章 基于邻域粗糙集的C4.5决策树分类算法
5.1 基于邻域粗糙集的C4.5决策树分类算法
5.1.1 C4.5算法简介
5.1.2 分裂属性的选择标准
5.1.3 连续属性分割阈值的选择方法
5.1.4 算法描述
5.2 实验分析
5.2.1 实验数据
5.2.2 实验结果
5.3 本章小结
第六章 总结与展望
参考文献
攻读学位期间的研究成果
致谢
本文编号:2949749
【文章来源】:青岛大学山东省
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 选题背景及意义
1.2 国内外研究现状
1.3 本文的主要内容和组织结构
第二章 粗糙集理论基础
2.1 经典粗糙集理论基础
2.2 邻域粗糙集理论基础
2.3 本章小结
第三章 基于邻域粗糙集的属性约简算法
3.1 前向贪心数值属性约简算法
3.2 前向搜索属性约简快速算法
3.3 基于邻域粗糙集的快速属性约简算法
3.4 本章小结
第四章 基于邻域粗糙集属性重要度的快速约简算法
4.1 基于K近邻属性重要度和相关系数的属性约简算法
4.1.1 K近邻属性重要度
4.1.2 相关系数及其性质
4.1.3 算法设计与实现
4.1.4 实验分析
4.2 基于Relief的快速属性约简算法
4.2.1 基于Relief的属性重要度算法
4.2.2 基于Relief的快速属性约简算法
4.2.3 实验分析
4.3 本章小结
第五章 基于邻域粗糙集的C4.5决策树分类算法
5.1 基于邻域粗糙集的C4.5决策树分类算法
5.1.1 C4.5算法简介
5.1.2 分裂属性的选择标准
5.1.3 连续属性分割阈值的选择方法
5.1.4 算法描述
5.2 实验分析
5.2.1 实验数据
5.2.2 实验结果
5.3 本章小结
第六章 总结与展望
参考文献
攻读学位期间的研究成果
致谢
本文编号:2949749
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2949749.html