基于粗糙集的分类学习研究
发布时间:2022-05-08 13:00
当今社会,大数据已成为最具代表性的时代特征之一,广泛地存在于各行各业及生活中。数据挖掘和机器学习是大数据技术的重要组成部分,通过对大数据信息挖掘和机器学习,构建大数据框架下的人工智能模型,是当今人工智能领域中的重要课题。分类是大数据挖掘的重要研究内容之一。作为数据挖掘的一个研究分支,分类的本质是通过对训练数据的类别学习,构造分类模型,并依据分类规则对未知样本进行类别预判。本文基于邻域粗糙集和模糊粗糙集理论建立了两种分类模型,设计了相应的分类算法。1.基于决策一致性的邻域粗糙分类。首先依照邻域粗糙集理论,对样本邻域进行了重新定义,并基于决策一致性原则,提出了样本的邻域纯度等相关概念。然后对样本邻域半径的选取方法进行讨论分析,使其满足决策一致性条件。针对样本分布情况的不同,提出了相应的样本邻域半径的选取办法。设计确定初级类中心样本及其相应半径取值算法。在算法迭代过程中,考虑到应尽可能缩短分类时间,引入了剪枝算法,去掉冗余样本,得到最终的类中心样本及其相应半径取值,完成训练学习过程。为了对未知样本进行类别预测,构建了基于决策一致性的邻域粗糙分类器,并利用UCI中数据集设计相关实验进行验证和分...
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 引言
1.2 邻域粗糙集研究概况
1.3 模糊粗糙集研究概况
1.4 本文的主要工作
2 基础知识
2.1 邻域粗糙集基础知识
2.2 模糊粗糙集基础知识
3 决策一致性自适应邻域分类
3.1 邻域粗糙分类规则与一致性的邻域
3.2 自适应邻域分类器
3.2.1 一致性自适应邻域半径的选取
3.2.2 初级类中心及其邻域半径
3.2.3 邻域关系剪枝与类中心剪枝
3.2.4 一致性自适应邻域分类器
3.3 实验分析
3.4 本章小结
4 邻域模糊粗糙分类
4.1 邻域模糊粗糙集决策模型
4.2 邻域模糊粗糙决策的融合
4.2.1 融合决策权重系数
4.2.2 权重系数最优化问题的矩阵表示
4.2.3 基于拉格朗日乘子法的优化学习
4.3 基于融合权重系数的粗糙分类算法
4.4 实验分析
4.5 本章小结
总结与展望
参考文献
论文发表情况
致谢
【参考文献】:
期刊论文
[1]基于改进分辨矩阵的属性约简方法[J]. 黄治国,杨晓骥. 计算机仿真. 2014(09)
[2]基于模糊集截集的模糊粗糙集模型[J]. 孙秉珍,巩增泰,焦永兰. 计算机工程与应用. 2009(08)
[3]基于邻域粗糙集的符号与数值属性快速约简算法[J]. 胡清华,赵辉,于达仁. 模式识别与人工智能. 2008(06)
[4]基于邻域粒化和粗糙逼近的数值属性约简[J]. 胡清华,于达仁,谢宗霞. 软件学报. 2008(03)
[5]模糊决策树算法与清晰决策树算法的比较研究[J]. 王熙照,孙娟,杨宏伟,赵明华. 计算机工程与应用. 2003(21)
[6]Rough集理论在不完备信息系统中的扩充[J]. 王国胤. 计算机研究与发展. 2002(10)
[7]粗糙集理论及其应用[J]. 韩祯祥,张琦,文福拴. 信息与控制. 1998(01)
硕士论文
[1]关于凸二次规划若干算法的研究[D]. 王建芳.大连海事大学 2008
[2]分类器设计及组合技术研究[D]. 郭亚琴.扬州大学 2007
本文编号:3651711
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 引言
1.2 邻域粗糙集研究概况
1.3 模糊粗糙集研究概况
1.4 本文的主要工作
2 基础知识
2.1 邻域粗糙集基础知识
2.2 模糊粗糙集基础知识
3 决策一致性自适应邻域分类
3.1 邻域粗糙分类规则与一致性的邻域
3.2 自适应邻域分类器
3.2.1 一致性自适应邻域半径的选取
3.2.2 初级类中心及其邻域半径
3.2.3 邻域关系剪枝与类中心剪枝
3.2.4 一致性自适应邻域分类器
3.3 实验分析
3.4 本章小结
4 邻域模糊粗糙分类
4.1 邻域模糊粗糙集决策模型
4.2 邻域模糊粗糙决策的融合
4.2.1 融合决策权重系数
4.2.2 权重系数最优化问题的矩阵表示
4.2.3 基于拉格朗日乘子法的优化学习
4.3 基于融合权重系数的粗糙分类算法
4.4 实验分析
4.5 本章小结
总结与展望
参考文献
论文发表情况
致谢
【参考文献】:
期刊论文
[1]基于改进分辨矩阵的属性约简方法[J]. 黄治国,杨晓骥. 计算机仿真. 2014(09)
[2]基于模糊集截集的模糊粗糙集模型[J]. 孙秉珍,巩增泰,焦永兰. 计算机工程与应用. 2009(08)
[3]基于邻域粗糙集的符号与数值属性快速约简算法[J]. 胡清华,赵辉,于达仁. 模式识别与人工智能. 2008(06)
[4]基于邻域粒化和粗糙逼近的数值属性约简[J]. 胡清华,于达仁,谢宗霞. 软件学报. 2008(03)
[5]模糊决策树算法与清晰决策树算法的比较研究[J]. 王熙照,孙娟,杨宏伟,赵明华. 计算机工程与应用. 2003(21)
[6]Rough集理论在不完备信息系统中的扩充[J]. 王国胤. 计算机研究与发展. 2002(10)
[7]粗糙集理论及其应用[J]. 韩祯祥,张琦,文福拴. 信息与控制. 1998(01)
硕士论文
[1]关于凸二次规划若干算法的研究[D]. 王建芳.大连海事大学 2008
[2]分类器设计及组合技术研究[D]. 郭亚琴.扬州大学 2007
本文编号:3651711
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3651711.html