基于不平衡数据集的支持向量机模型与算法研究

发布时间:2017-10-06 16:09

  本文关键词:基于不平衡数据集的支持向量机模型与算法研究


  更多相关文章: 支持向量机 不平衡数据集 类内方差 一类分类 最小二乘


【摘要】:支持向量机(Support Vector Machines,简称SVMs)是一种以统计学习理论为基础的重要的机器学习方法。它是采用结构风险最小化原理,利用核技巧将非线性问题转化为高维空间下的线性学习,从而在一定程度上解决了过拟合、维数灾难等问题。支持向量机及其改进模型在处理不平衡问题方面已经取得一定的研究成果。 目前,学习不平衡数据集是机器学习的一个重要的研究方向。不平衡数据集是指训练样本集中某一类的样本数目明显少于其它类的样本数目。传统的分类方法在处理不平衡数据集时,分类超平面会向少数类偏移,容易造成少数类被分错。实际上,少数类通常具有更加重要的研究价值。因此,提高少数类的分类准确率是研究不平衡数据集的一个重要目的。 本文针对不平衡数据问题,以支持向量机为方法进行了较为深入的论述和研究。主要工作有如下几个方面: (1)针对不平衡数据集问题,注意到类内分散程度对分类器性能的影响,本文通过对两类类内方差赋予不同的权值,建立了加权类内方差支持向量机模型(Weighted Within-Class Scatter Biased Support Vector Machine,简称WWCS-BSVM)。其中,赋予少数类的类内方差权值要小于多数类的权值。这样使得少数类的类内方差相比多数类的更聚集,减轻了因数据不平衡造成的分类超平面向少数类的偏移。从而提高少数类的分类准确率。 (2)一分类支持向量机在处理不平衡数据集时取得了较好的效果。该算法在训练过程中赋予每个样本相同的惩罚参数。实际上,训练样本在构建分类超平面时起的作用是不一样的。因此本文引入了模糊隶属度的概念,对每个训练样本根据它在训练过程中起的作用赋予其相应的权值。提出了最小二乘模糊一分类支持向量机模型(Least Squares Fuzzy One-Class Support Vector Machine,简称LSFOCSVM)和求解算法。 (3)对训练样本信息不确定的情况,提出了模糊集上最小二乘一分类支持向量机(Least Squares One-Class Support Vector Fuzzy Machine,简称LSOCSVFM)。在新方法中,相关参数比如权向量和偏置项均用模糊数来表示。该模型通过一个线性方程组来求解,降低了训练时间。
【关键词】:支持向量机 不平衡数据集 类内方差 一类分类 最小二乘
【学位授予单位】:中国农业大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP18
【目录】:
  • 摘要4-5
  • Abstract5-7
  • 符号表7-9
  • 目录9-11
  • 第一章 绪论11-16
  • 1.1 研究背景11-12
  • 1.2 研究现状12-14
  • 1.3 研究内容与目标14-15
  • 1.4 论文的组织结构15-16
  • 第二章 支持向量机模型与常用的几种处理不平衡数据的方法16-28
  • 2.1 支持向量机及其改进模型16-23
  • 2.2 模糊结构23-26
  • 2.3 不平衡数据集分类方法的评价标准26-27
  • 2.4 本章小结27-28
  • 第三章 加权类内方差支持向量机28-45
  • 3.1 线性加权类内方差支持向量机28-30
  • 3.2 非线性加权类内方差支持向量机30-32
  • 3.3 数值实验32-41
  • 3.4 本章小结41-45
  • 第四章 最小二乘模糊一分类支持向量机45-55
  • 4.1 模糊一分类支持向量机45
  • 4.2 最小二乘模糊一分类支持向量机45-47
  • 4.3 数值实验47-50
  • 4.4 本章小结50-55
  • 第五章 模糊集上最小二乘一分类支持向量机55-62
  • 5.1 模糊集上线性最小二乘一分类支持向量机55-57
  • 5.2 模糊集上非线性最小二乘一分类支持向量机57
  • 5.3 数值实验57-61
  • 5.4 本章小结61-62
  • 第六章 结论与展望62-64
  • 6.1 结论62
  • 6.2 展望62-64
  • 参考文献64-72
  • 致谢72-73
  • 作者简介73

【参考文献】

中国期刊全文数据库 前4条

1 王和勇;樊泓坤;姚正安;;SMOTE和Biased-SVM相结合的不平衡数据分类方法[J];计算机科学;2008年05期

2 缪志敏;潘志松;袁伟伟;赵陆文;;一种新的基于SVDD的多类分类算法[J];计算机科学;2009年03期

3 龙军;殷建平;祝恩;赵文涛;;针对入侵检测的代价敏感主动学习算法[J];南京大学学报(自然科学版);2008年05期

4 卢增祥,李衍达;交互支持向量机学习算法及其应用[J];清华大学学报(自然科学版);1999年07期

中国博士学位论文全文数据库 前1条

1 唐明珠;类别不平衡和误分类代价不等的数据集分类方法及应用[D];中南大学;2012年



本文编号:983709

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/983709.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户14424***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com