基于邻域粗糙集的约简算法及分类器的研究
发布时间:2021-05-06 03:35
粗糙集理论是一种处理不确定、不一致等不完备信息的新型数据分析工具,被广泛应用于数据挖掘、决策分析和故障诊断等领域。在粗糙集理论中,经典的Pawlak粗糙集模型只适合处理离散型变量,不能直接处理连续型变量。为了解决此问题,通过引入邻域粒化和粗糙逼近的概念引入邻域粗糙集模型,可以同时支持连续型和离散型两种数据类型,拓宽了粗糙集理论的应用范围。属性约简是粗糙集理论的核心内容之一。属性约简是指在保持原有决策系统分类和决策能力不变的情况下,删除冗余属性。本文主要研究内容就是对现有的属性约简算法进行改进,并通过实验进行验证。除此之外,将改进的算法与决策树分类算法相结合,实现更有效的分类。本文研究工作如下:1、在基于邻域粗糙集的属性约简算法中,正域计算是保证其有效性的重要依据,也是影响其时间开销的最主要部分。为了减少算法开销,采取矩阵保留策略,利用矩阵记录样本间度量计算值的平方,将原本n维上的度量计算改进为1维上的计算。基于上述方法对F2HARNRS算法进行改进,提出基于矩阵保留策略的前向搜索属性约简算法。实验证明该算法在提高算法效率方面是有效的。2、计算邻域样本时,δ是一个关键的参数,它的取值影响...
【文章来源】:青岛大学山东省
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 引言
1.1 选题背景与意义
1.2 国内外研究历程及现状
1.2.1 粗糙集理论
1.2.2 决策树分类算法
1.3 本文的研究内容和组织结构
1.4 本章小结
第二章 理论基础
2.1 经典粗糙集理论基础知识
2.1.1 知识与分类
2.1.2 上近似与下近似
2.1.3 信息系统和决策系统
2.1.4 依赖度和属性重要度
2.1.5 属性的约简与核
2.2 邻域粗糙集理论基础知识
2.2.1 邻域粒化
2.2.2 邻域粗糙集逼近
2.2.3 邻域决策系统
2.3 本章小结
第三章 基于粗糙集的属性约简算法
3.1 基于经典粗糙集的属性约简算法
3.1.1 基于pawlak属性重要度的属性约简算法
3.1.2 基于差别矩阵的属性约简算法
3.1.3 基于信息熵的属性约简算法
3.2 基于邻域粗糙集的属性约简算法
3.2.1 前向贪心数值属性约简算法
3.2.2 前向搜索属性约简快速算法
3.2.3 基于邻域粗糙集的快速属性约简算法
3.3 本章小结
第四章 基于矩阵保留策略的邻域粗糙集属性约简算法
4.1 矩阵保留策略
4.2 基于矩阵保留策略的前向搜索属性约简算法
4.2.1 基于矩阵保留策略的正域计算算法
4.2.2 基于矩阵保留策略的前向搜索属性约简算法
4.2.3 实验分析
4.3 基于矩阵保留策略的快速属性约简算法
4.3.1 基于矩阵保留策略的正域计算算法
4.3.2 基于矩阵保留策略的快速属性约简算法
4.3.3 实验分析
4.4 本章小结
第五章 基于正域的决策树算法
5.1 基于正域的决策树算法
5.1.1 分类属性的选择标准
5.1.2 叶节点的选择方式
5.1.3 算法描述
5.2 实验分析
5.2.1 实验环境
5.2.2 实验结果
5.3 本章小结
第六章 总结与展望
参考文献
攻读学位期间的研究成果
致谢
【参考文献】:
期刊论文
[1]基于投票式属性重要度的快速属性约简算法[J]. 王蓉,刘遵仁,纪俊. 计算机科学. 2018(07)
[2]基于邻域粗糙集下知识划分的信息表降维[J]. 彭潇然,刘遵仁,纪俊. 计算机应用研究. 2019(01)
[3]不完备邻域粗糙集的不确定性度量和属性约简[J]. 姚晟,汪杰,徐风,陈菊. 计算机应用. 2018(01)
[4]基于属性重要度的决策树算法[J]. 王蓉,刘遵仁,纪俊. 计算机科学. 2017(S2)
[5]基于α信息熵的模糊粗糙属性约简方法[J]. 潘瑞林,李园沁,张洪亮,伊长生,樊杨龙,杨庭圣. 控制与决策. 2017(02)
[6]面向大数据分析的决策树算法[J]. 张棪,曹健. 计算机科学. 2016(S1)
[7]决策粗糙集理论研究现状与展望[J]. 于洪,王国胤,姚一豫. 计算机学报. 2015(08)
[8]基于邻域粗糙集的多标记分类特征选择算法[J]. 段洁,胡清华,张灵均,钱宇华,李德玉. 计算机研究与发展. 2015(01)
[9]基于块集的邻域粗糙集的快速约简算法[J]. 娄畅,刘遵仁,郭功振. 计算机科学. 2014(S2)
[10]优化决策树改进挖掘算法仿真[J]. 梁凤兰. 计算机仿真. 2013(11)
本文编号:3171156
【文章来源】:青岛大学山东省
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 引言
1.1 选题背景与意义
1.2 国内外研究历程及现状
1.2.1 粗糙集理论
1.2.2 决策树分类算法
1.3 本文的研究内容和组织结构
1.4 本章小结
第二章 理论基础
2.1 经典粗糙集理论基础知识
2.1.1 知识与分类
2.1.2 上近似与下近似
2.1.3 信息系统和决策系统
2.1.4 依赖度和属性重要度
2.1.5 属性的约简与核
2.2 邻域粗糙集理论基础知识
2.2.1 邻域粒化
2.2.2 邻域粗糙集逼近
2.2.3 邻域决策系统
2.3 本章小结
第三章 基于粗糙集的属性约简算法
3.1 基于经典粗糙集的属性约简算法
3.1.1 基于pawlak属性重要度的属性约简算法
3.1.2 基于差别矩阵的属性约简算法
3.1.3 基于信息熵的属性约简算法
3.2 基于邻域粗糙集的属性约简算法
3.2.1 前向贪心数值属性约简算法
3.2.2 前向搜索属性约简快速算法
3.2.3 基于邻域粗糙集的快速属性约简算法
3.3 本章小结
第四章 基于矩阵保留策略的邻域粗糙集属性约简算法
4.1 矩阵保留策略
4.2 基于矩阵保留策略的前向搜索属性约简算法
4.2.1 基于矩阵保留策略的正域计算算法
4.2.2 基于矩阵保留策略的前向搜索属性约简算法
4.2.3 实验分析
4.3 基于矩阵保留策略的快速属性约简算法
4.3.1 基于矩阵保留策略的正域计算算法
4.3.2 基于矩阵保留策略的快速属性约简算法
4.3.3 实验分析
4.4 本章小结
第五章 基于正域的决策树算法
5.1 基于正域的决策树算法
5.1.1 分类属性的选择标准
5.1.2 叶节点的选择方式
5.1.3 算法描述
5.2 实验分析
5.2.1 实验环境
5.2.2 实验结果
5.3 本章小结
第六章 总结与展望
参考文献
攻读学位期间的研究成果
致谢
【参考文献】:
期刊论文
[1]基于投票式属性重要度的快速属性约简算法[J]. 王蓉,刘遵仁,纪俊. 计算机科学. 2018(07)
[2]基于邻域粗糙集下知识划分的信息表降维[J]. 彭潇然,刘遵仁,纪俊. 计算机应用研究. 2019(01)
[3]不完备邻域粗糙集的不确定性度量和属性约简[J]. 姚晟,汪杰,徐风,陈菊. 计算机应用. 2018(01)
[4]基于属性重要度的决策树算法[J]. 王蓉,刘遵仁,纪俊. 计算机科学. 2017(S2)
[5]基于α信息熵的模糊粗糙属性约简方法[J]. 潘瑞林,李园沁,张洪亮,伊长生,樊杨龙,杨庭圣. 控制与决策. 2017(02)
[6]面向大数据分析的决策树算法[J]. 张棪,曹健. 计算机科学. 2016(S1)
[7]决策粗糙集理论研究现状与展望[J]. 于洪,王国胤,姚一豫. 计算机学报. 2015(08)
[8]基于邻域粗糙集的多标记分类特征选择算法[J]. 段洁,胡清华,张灵均,钱宇华,李德玉. 计算机研究与发展. 2015(01)
[9]基于块集的邻域粗糙集的快速约简算法[J]. 娄畅,刘遵仁,郭功振. 计算机科学. 2014(S2)
[10]优化决策树改进挖掘算法仿真[J]. 梁凤兰. 计算机仿真. 2013(11)
本文编号:3171156
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3171156.html