基于覆盖约简的符号型数据分类及主动学习
发布时间:2023-02-27 17:31
分类研究作为机器学习、模式识别和数据挖掘等领域最主要的研究任务,一直受到学术界、工业界的持续广泛的关注。大数据时代的到来,更是为分类研究带来了前所未有的机遇与挑战。随着粗糙集技术,特别是邻域覆盖粗糙集技术的不断发展和完善,大量相关算法被相继提出。特别是基于覆盖约简的分类方法,已成为当前的研究热点。本文就基于代表的邻域覆盖粗糙集分类算法,重点研究了不同相似度计算方法以及不同冲突解决机制对其分类性能的影响;同时根据算法特点设计出与之对应的五种主动学习策略,使改造后的算法能应用在主动学习的任务场景中。首先,本文重现了一种覆盖约简算法——基于代表的邻域覆盖粗糙集分类算法,并详细介绍了该算法在训练和测试阶段的工作原理。然后,本文对比了 Overlap,Eskin,OF,IOF,Gooda113和Gooda114六种不同相似度计算方法,在训练阶段对分类精度的影响。因为名词型数据的相似度计算方法与数值型数据的不同,它们会考虑值域空间以及分布规律等其他信息。所以研究不同相似度计算方法下的算法分类性能尤为重要。实验发现,Overlap和IOF相似度明显更适用于原算法。另外,本文还提出相似度模型、支持度模...
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 分类研究现状
1.2.2 粗糙集研究现状
1.2.3 主动学习研究现状
1.3 本文工作创新
1.4 结构组织
第2章 背景知识及相关理论
2.1 决策信息系统
2.2 粗糙集理论
2.2.1 知识
2.2.2 不可分辨关系与弱不可分辨关系
2.2.3 上近似和下近似
2.2.4 相似关系
2.3 邻居与邻域
2.4 K最近邻算法
2.5 规则学习
2.6 UCI数据集
2.7 本章小结
第3章 基于代表的邻域覆盖粗糙集分类算法
3.1 问题描述
3.2 算法描述
3.2.1 分类流程
3.2.2 运行实例
3.2.3 算法伪代码
3.3 实验结果
3.3.1 分类精度对比实验
3.3.2 代表数量对比实验
3.4 本章小结
第4章 基于不同相似度的代表选举算法研究
4.1 其他相似度
4.1.1 ESKIN相似度
4.1.2 IOF相似度
4.1.3 OF相似度
4.1.4 GOODALL3相似度
4.1.5 GOODALL4相似度
4.2 运行实例
4.3 实验结果
4.3.1 分类精度对比实验
4.3.2 平均代表阈值对比实验
4.4 本章小结
第5章 基于不同冲突解决的代表选举算法研究
5.1 冲突解决方案
5.1.1 相似度模型
5.1.2 支持度模型
5.1.3 密度模型
5.1.4 属性权重模型
5.2 实验结果
5.3 本章小结
第6章 基于代表的主动学习分类研究
6.1 问题描述
6.2 算法描述
6.2.1 分类流程
6.2.2 基于代表性的主动学习策略
6.2.3 基于不确定性的主动学习策略
6.3 实验结果
6.3.1 基于代表性的主动学习策略
6.3.2 基于不确定性的主动学习策略
6.3.3 与其他主动学习算法的比较
6.3.4 不同初始训练集下的主动学习比较
6.4 本章小结
第7章 结论
7.1 本文工作总结
7.2 未来工作展望
致谢
参考文献
攻读硕士学位期间发表的论文及科研成果
本文编号:3751146
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 分类研究现状
1.2.2 粗糙集研究现状
1.2.3 主动学习研究现状
1.3 本文工作创新
1.4 结构组织
第2章 背景知识及相关理论
2.1 决策信息系统
2.2 粗糙集理论
2.2.1 知识
2.2.2 不可分辨关系与弱不可分辨关系
2.2.3 上近似和下近似
2.2.4 相似关系
2.3 邻居与邻域
2.4 K最近邻算法
2.5 规则学习
2.6 UCI数据集
2.7 本章小结
第3章 基于代表的邻域覆盖粗糙集分类算法
3.1 问题描述
3.2 算法描述
3.2.1 分类流程
3.2.2 运行实例
3.2.3 算法伪代码
3.3 实验结果
3.3.1 分类精度对比实验
3.3.2 代表数量对比实验
3.4 本章小结
第4章 基于不同相似度的代表选举算法研究
4.1 其他相似度
4.1.1 ESKIN相似度
4.1.2 IOF相似度
4.1.3 OF相似度
4.1.4 GOODALL3相似度
4.1.5 GOODALL4相似度
4.2 运行实例
4.3 实验结果
4.3.1 分类精度对比实验
4.3.2 平均代表阈值对比实验
4.4 本章小结
第5章 基于不同冲突解决的代表选举算法研究
5.1 冲突解决方案
5.1.1 相似度模型
5.1.2 支持度模型
5.1.3 密度模型
5.1.4 属性权重模型
5.2 实验结果
5.3 本章小结
第6章 基于代表的主动学习分类研究
6.1 问题描述
6.2 算法描述
6.2.1 分类流程
6.2.2 基于代表性的主动学习策略
6.2.3 基于不确定性的主动学习策略
6.3 实验结果
6.3.1 基于代表性的主动学习策略
6.3.2 基于不确定性的主动学习策略
6.3.3 与其他主动学习算法的比较
6.3.4 不同初始训练集下的主动学习比较
6.4 本章小结
第7章 结论
7.1 本文工作总结
7.2 未来工作展望
致谢
参考文献
攻读硕士学位期间发表的论文及科研成果
本文编号:3751146
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3751146.html