当前位置:主页 > 科技论文 > 自动化论文 >

V-支持向量分类机中若干问题的研究

发布时间:2017-04-13 14:12

  本文关键词:V-支持向量分类机中若干问题的研究,,由笔耕文化传播整理发布。


【摘要】:支持向量分类机(Support Vector Classification, SVC)是Vapnik等人于1995年提出的一类机器学习算法,它以统计学习理论(statistical learning theory, SLT)为基础,具有简洁的数学形式、标准快捷的训练方法.与传统的基于经验风险最小化(experience risk minimization, ERM)原则的机器学习算法,例如:神经网络、决策树等不同,支持向量分类机是基于结构风险最小化(structure risk minimization)原则,考虑的是经验风险和置信界之和的最小化.正因为如此,支持向量分类机在上个世纪90年代受到广泛的关注并得到了迅速的完善和发展.它具有扎实的理论基础、更强的泛化能力,在解决小样本、非线性等实际问题的性能也表现得很优异,因此成为主流的机器学习算法之一.目前支持向量分类机被广泛应用于模式识别、生物信息学、文本和手写识别等数据挖掘问题.由于C-支持向量分类机(C-SVC)中参数C的取值范围是(0,+∞)并且本身也没有定量的含义,在实际应用中C的取值往往很难取舍.因此Scholkopf等人于2000年利用参数v代替C提出了v-支持向量分类机(v-SVC),通过替换,参数v值本身就含有一定的意义.本论文主要做了以下三方面的工作:(1)探究了v-SVC中参数v与总样本数f之间的关系.利用Markov不等式及其概率论相关知识,证明了参数v在满足一定条件下以概率1渐进逼近于支持向量个数和总样本数之比q/l;(2)研究了v-SVC与C-SVC中参数v与参数C之间的映射关系.从UCI数据库中下载:breast-cancer-wisconsin (diagnostic), iris, letter-recognition数据集,利用RStudio编程实现C-SVC并进行了数值实验.实验结果表明:训练样本集在选取非正定核函数下参数C与参数v的映射关系并不满足非增性;(3)研究了如何利用准确率和召回率选取最优参数v来获得最优分类器.从UCI数据库中下载balance-scale, breast-cancer-wisconsin (original), iris, letter-recognition, waveform这五个标准数据集,利用RStudio编程实现v-SVC并进行了实验,实验中选取数据的2/3作为训练数据,1/3作为测试数据,计算出取不同v值时的准确率和召回率以及相应的F-值.并依据F-值得到了在取不同核函数时的最优参数区间.实验结果表明:在得出的最优参数区间内,v-SVC保持了在训练集和测试集上较高的准确率和召回率.
【关键词】:v-支持向量分类机 核函数 混淆矩阵 准确率 召回率 F-值
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
  • 摘要6-8
  • Abstract8-14
  • 第一章 引言14-20
  • 1.1 支持向量分类机的发展现状14-15
  • 1.2 支持向量分类机的研究背景15-17
  • 1.3 支持向量分类机相关概念17-20
  • 第二章 C-支持向量分类机原理20-28
  • 2.1 C-线性可分支持向量分类机20-21
  • 2.2 C-线性支持向量分类机21-25
  • 2.3 C-支持向量分类机25-28
  • 第三章 v-支持向量分类机原理28-36
  • 3.1 v-线性支持向量分类机28-29
  • 3.2 v-支持向量分类机29-31
  • 3.3 v-支持向量分类机的性质31-32
  • 3.4 参数v与总样本数l的关系证明32-36
  • 第四章 参数v和参数C关系的探究36-43
  • 4.1 参数v与参数C的相关定理36-37
  • 4.2 基于正定核下参数v与参数C的关系37-40
  • 4.3 基于非正定核下参数v与参数C的关系40-43
  • 第五章 最优参数v的选择43-52
  • 5.1 评估分类器性能的度量43-45
  • 5.2 最优参数v的选择45-52
  • 5.2.1 基于正定核linear下最优参数v的选择46-47
  • 5.2.2 基于正定核radial下最优参数v的选择47-48
  • 5.2.3 基于非正定核Sigmoid下最优参数v的选择48-50
  • 5.2.4 最优参数v的选择结果50-52
  • 第六章 总结与展望52-54
  • 参考文献54-58
  • 附录58-65
  • 致谢65

【参考文献】

中国硕士学位论文全文数据库 前1条

1 沈丽静;ν-支持向量分类机在心肌梗塞疾病诊断中的应用[D];华东师范大学;2014年


  本文关键词:V-支持向量分类机中若干问题的研究,由笔耕文化传播整理发布。



本文编号:303782

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/303782.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户83d3d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com