基于随机子空间的SVM分类算法研究
发布时间:2017-10-01 01:17
本文关键词:基于随机子空间的SVM分类算法研究
更多相关文章: 支持向量机 随机子空间 核函数 分层抽样 不平衡数据
【摘要】:支持向量机是在坚实理论基础上发展起来的一种机器学习方法,它能很好的解决关于小样本、非线性、高维度、局部极小等类似问题。目前,支持向量机作为一种有潜力的分类技术,在数据分类方面得到了广泛的应用和研究。但早期提出的基于支持向量机的数据分类方法,在解决海量数据分类特别是不平衡的数据分类时会出现很多问题,严重影响着数据分类算法的计算效率和准确度。随机子空间方法是为了适应特征数据筛选的挑战,其思想就是从大量特征数据中选出真正需要的特征,以降低数据集的特征维度或平衡特征分布,它对数据预处理方面有着突出的贡献。对此,论文提出基于随机子空间的SVM分类算法研究,主要的研究工作分为以下两个方面:1.基于随机特征子空间及加权核函数的SVM算法结合随机子空间和核函数思想,提出基于随机特征子空间及加权核函数的SVM算法。首先通过采用ReliefF算法计算特征权值,然后基于随机特征子空间方法,根据特征权值选择特征,最后将选出的特征及其权值对核函数中的内积进行加权计算,从而减少了核函数中内积加权的计算复杂度。在平衡数据集的分类研究中,该方法在一定程度上解决了传统的SVM算法缺乏高效率和低准确率的问题。2.基于支持向量机的不平衡样本集分类算法结合重采样技术和分层抽样方法,提出基于支持向量机的不平衡样本集分类算法。该算法以支持向量机为基础,首先利用分层抽样方法,选出样本的正、负特征,以平衡样本底层特征分布,然后在此基础上采用重采样技术,对样本数量进行平衡,因此从样本底层特征分布和样本数量上很好的解决了数据的不平衡。在不平衡数据集的分类研究中,该方法避免了仅考虑数据样本数量不平衡而忽略样本底层特征分布不平衡的现象,使不平衡数据对SVM分类器的影响程度得到进一步降低。
【关键词】:支持向量机 随机子空间 核函数 分层抽样 不平衡数据
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要5-6
- ABSTRACT6-8
- 第一章 绪论8-12
- 1.1 研究背景和意义8
- 1.2 国内外研究现状8-10
- 1.3 本文主要内容10
- 1.4 本文结构安排10-12
- 第二章 支持向量机12-22
- 2.1 最优分类超平面12-14
- 2.2 SVM分类原理14-18
- 2.3 SVM核函数18-20
- 2.4 本章小结20-22
- 第三章 基于随机特征子空间及加权核函数的SVM算法(RFSWK-SVM)22-33
- 3.1 RFSWK-SVM算法的相关理论22-27
- 3.1.1 随机子空间22-23
- 3.1.2 特征选择23-27
- 3.2 RFSWK-SVM算法思想27-30
- 3.3 实验结果及分析30-32
- 3.4 本章小结32-33
- 第四章 基于支持向量机的不平衡样本集分类算法(IDC-SVM)33-42
- 4.1 不平衡数据集的概述33-36
- 4.2 IDC-SVM算法的相关理论36-39
- 4.3 IDC-SVM算法思想39-40
- 4.4 实验结果及分析40-41
- 4.5 本章小结41-42
- 第五章 总结与展望42-44
- 5.1 总结42-43
- 5.2 展望43-44
- 参考文献44-48
- 作者简介及学期间所取得的科研成果48-49
- 致谢49
本文编号:951503
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/951503.html