基于实验的分类挖掘若干问题研究
发布时间:2023-05-06 22:05
分类是数据挖掘领域研究的重点内容之一。分类挖掘的主要目标是在已知类别的样本集中训练出一个具有较强泛化能力的模型,以便对新数据能有一个准确的预测。目前,虽然研究者们为了提高预测准确度已经做了大量研究,并取得了一系列成果,但仍存在很多问题值得深入研究与探讨。本文主要对分类数据的特征选择、分类算法的比较分析以及分类算法的集成等方面的相关问题进行了探索研究,并对研究结果进行了实验验证。论文首先探讨了分类数据的特征选择问题。针对mRMR特征选择算法对所有数据集的特征评价标准固定,而忽略了不同数据集的冗余性与相关性不同的问题,提出了一种改进的mRMR算法。该算法通过加入权重因子,调节不同数据集评价标准中最大相关性D与最小冗余性R的比例,从而更好拟合不同数据集的特性,并运用UCI数据集进行了实验分析,实验结果验证了该方法的有效性。然后,针对分类算法种类多,人们面对实际问题不知道如何确定算法的问题,对其中的9种典型分类算法,从数据集类别数这一分类性能影响因素入手,运用实验方法分析了其在解决二分类问题与多分类问题时的性能差异。在对比实验中,论文针对这两方面的问题,从UCI数据集中各选出17个数据集,在对...
【文章页数】:94 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状及文献综述
1.2.1 分类数据特征选择方案的研究现状
1.2.2 分类算法比较分析研究现状
1.2.3 分类算法集成方法研究现状
1.2.4 研究评述
1.3 研究内容及技术路线
1.3.1 研究内容
1.3.2 研究方法
1.3.3 技术路线
1.4 本章小结
2 相关理论概述
2.1 分类挖掘的概念与过程
2.2 分类性能评估准则与方法
2.2.1 评价准则
2.2.2 性能评估方法
2.3 集成学习理论
2.3.1 集成学习的基本概念
2.3.2 集成学习的作用
2.3.3 集成学习的过程
2.3.4 集成学习的主要算法
2.4 粒子群算法
2.5 本章小结
3 对特征选择算法MRMR的改进研究
3.1 特征选择算法MRMR的功能特点及描述
3.1.1 特征选择算法mRMR的功能
3.1.2 特征选择算法mRMR描述
3.2 对MRMR算法的改进思路及方案
3.2.1 对mRMR算法改进的必要性
3.2.2 对mRMR算法的改进方案
3.3 改进MRMR特征选择算法的实验验证
3.3.1 实验环境与实验数据
3.3.2 实验过程设计
3.3.3 实验参数设置
3.3.4 实验与结果分析
3.4 本章小结
4 典型分类算法的实验对比分析
4.1 参与对比的分类算法选择
4.2 实验环境构建与实验数据选择
4.2.1 实验环境
4.2.2 实验数据的选择
4.2.3 数据预处理
4.3 分类算法参数的选择与设置
4.4 实验结果分析
4.4.1 分类精度的比较分析
4.4.2 分类效率的比较分析
4.4.3 可伸缩性的比较分析
4.4.4 鲁棒性的比较分析
4.5 本章小结
5 基于改进粒子群算法的分类算法集成研究
5.1 分类算法集成方法比较
5.2 粒子群算法改进的背景及策略
5.3 实验方法分析
5.3.1 改进粒子群算法优化权重的过程
5.3.2 基于改进粒子群算法集成分类算法的实施过程
5.4 实验与结果分析
5.4.1 实验环境与实验数据
5.4.2 实验内容设计
5.4.3 实验结果与分析
5.5 本章小结
6 结论与展望
6.1 研究结论
6.2 研究不足与展望
致谢
参考文献
附录 :典型分类算法性能的原始实验测试结果
攻读硕士学位期间的主要研究成果及奖励情况
本文编号:3809688
【文章页数】:94 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状及文献综述
1.2.1 分类数据特征选择方案的研究现状
1.2.2 分类算法比较分析研究现状
1.2.3 分类算法集成方法研究现状
1.2.4 研究评述
1.3 研究内容及技术路线
1.3.1 研究内容
1.3.2 研究方法
1.3.3 技术路线
1.4 本章小结
2 相关理论概述
2.1 分类挖掘的概念与过程
2.2 分类性能评估准则与方法
2.2.1 评价准则
2.2.2 性能评估方法
2.3 集成学习理论
2.3.1 集成学习的基本概念
2.3.2 集成学习的作用
2.3.3 集成学习的过程
2.3.4 集成学习的主要算法
2.4 粒子群算法
2.5 本章小结
3 对特征选择算法MRMR的改进研究
3.1 特征选择算法MRMR的功能特点及描述
3.1.1 特征选择算法mRMR的功能
3.1.2 特征选择算法mRMR描述
3.2 对MRMR算法的改进思路及方案
3.2.1 对mRMR算法改进的必要性
3.2.2 对mRMR算法的改进方案
3.3 改进MRMR特征选择算法的实验验证
3.3.1 实验环境与实验数据
3.3.2 实验过程设计
3.3.3 实验参数设置
3.3.4 实验与结果分析
3.4 本章小结
4 典型分类算法的实验对比分析
4.1 参与对比的分类算法选择
4.2 实验环境构建与实验数据选择
4.2.1 实验环境
4.2.2 实验数据的选择
4.2.3 数据预处理
4.3 分类算法参数的选择与设置
4.4 实验结果分析
4.4.1 分类精度的比较分析
4.4.2 分类效率的比较分析
4.4.3 可伸缩性的比较分析
4.4.4 鲁棒性的比较分析
4.5 本章小结
5 基于改进粒子群算法的分类算法集成研究
5.1 分类算法集成方法比较
5.2 粒子群算法改进的背景及策略
5.3 实验方法分析
5.3.1 改进粒子群算法优化权重的过程
5.3.2 基于改进粒子群算法集成分类算法的实施过程
5.4 实验与结果分析
5.4.1 实验环境与实验数据
5.4.2 实验内容设计
5.4.3 实验结果与分析
5.5 本章小结
6 结论与展望
6.1 研究结论
6.2 研究不足与展望
致谢
参考文献
附录 :典型分类算法性能的原始实验测试结果
攻读硕士学位期间的主要研究成果及奖励情况
本文编号:3809688
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3809688.html