基于高维小样本数据和类别不平衡数据的反距离加权支持向量机
发布时间:2023-04-19 05:00
分类的目的在于根据其特征将数据“分门别类”,在数据挖掘中的研究中备受人们的关注。分类问题包含了两个基本过程:学习和分类。在学习的过程中,利用有效的学习方法,从已知类别的训练数据集中学习一个分类器;在分类的过程中,使用学习得到的分类器,对类别未知的数据进行分类。由此可见,分类的准确程度依赖于分类器的准确性,所以分类的重点在于分类器的学习。支持向量机(SVM)和距离加权判别(DWD)是两个非常常用的分类算法,其搜索最佳分离超平面的策略均是使得间隔最大化。在SVM中,只有支持向量才会对分离超平面的学习有影响,所以对类别不平衡数据不敏感。但是,在损失最小化的过程中,SVM容易出现高维小样本数据下的“数据堆积”现象,即在分离超平面两侧的间隔边界上堆积了很多样本点(即支持向量),造成过度拟合。在DWD中,所有样本点都对分离超平面的学习有不同程度的影响,所以可以有效地解决高维小样本数据的过拟合问题。但是,面对类别不平衡数据时,DWD为了减少整体误分类,容易偏向于多数类,从而将分离超平面推向少数类一侧。灵活分类器(FLAME)和距离加权支持向量机(DWSVM)的提出,就是为了解决上述提到的高维小样本数...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.2 研究现状
1.3 本文的主要贡献
1.4 本文的研究内容与结构安排
第二章 数据挖掘概述
2.1 数据库中的知识发现
2.2 数据挖掘
2.3 数据挖掘的方法(任务)
2.4 数据挖掘的技术
第三章 一些经典的分类算法
3.1 分类和损失函数
3.2 支持向量机(SVM)
3.3 距离加权判别(DWD)
3.4 模糊支持向量机(FSVM)
第四章 高维小样本数据和类别不平衡数据的分类问题
4.1 高维小样本数据的过拟合问题
4.2 类别不平衡数据的敏感问题
4.3 灵活分类器(FLAME)
4.4 距离加权支持向量机(DWSVM)
第五章 基于高维小样本数据和类别不平衡数据分类的新算法
5.1 反距离加权支持向量机(IDWSVM)
5.2 松弛变量及惩罚参数的分析
第六章 实例分析
6.1 高维小样本数据
6.2 类别不平衡数据
第七章 总结与展望
7.1 总结
7.2 展望
参考文献
致谢
学位论文评阅及答辩情况表
本文编号:3793765
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.2 研究现状
1.3 本文的主要贡献
1.4 本文的研究内容与结构安排
第二章 数据挖掘概述
2.1 数据库中的知识发现
2.2 数据挖掘
2.3 数据挖掘的方法(任务)
2.4 数据挖掘的技术
第三章 一些经典的分类算法
3.1 分类和损失函数
3.2 支持向量机(SVM)
3.3 距离加权判别(DWD)
3.4 模糊支持向量机(FSVM)
第四章 高维小样本数据和类别不平衡数据的分类问题
4.1 高维小样本数据的过拟合问题
4.2 类别不平衡数据的敏感问题
4.3 灵活分类器(FLAME)
4.4 距离加权支持向量机(DWSVM)
第五章 基于高维小样本数据和类别不平衡数据分类的新算法
5.1 反距离加权支持向量机(IDWSVM)
5.2 松弛变量及惩罚参数的分析
第六章 实例分析
6.1 高维小样本数据
6.2 类别不平衡数据
第七章 总结与展望
7.1 总结
7.2 展望
参考文献
致谢
学位论文评阅及答辩情况表
本文编号:3793765
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3793765.html