V-支持向量分类机中若干问题的研究
发布时间:2017-04-13 14:12
本文关键词:V-支持向量分类机中若干问题的研究,,由笔耕文化传播整理发布。
【摘要】:支持向量分类机(Support Vector Classification, SVC)是Vapnik等人于1995年提出的一类机器学习算法,它以统计学习理论(statistical learning theory, SLT)为基础,具有简洁的数学形式、标准快捷的训练方法.与传统的基于经验风险最小化(experience risk minimization, ERM)原则的机器学习算法,例如:神经网络、决策树等不同,支持向量分类机是基于结构风险最小化(structure risk minimization)原则,考虑的是经验风险和置信界之和的最小化.正因为如此,支持向量分类机在上个世纪90年代受到广泛的关注并得到了迅速的完善和发展.它具有扎实的理论基础、更强的泛化能力,在解决小样本、非线性等实际问题的性能也表现得很优异,因此成为主流的机器学习算法之一.目前支持向量分类机被广泛应用于模式识别、生物信息学、文本和手写识别等数据挖掘问题.由于C-支持向量分类机(C-SVC)中参数C的取值范围是(0,+∞)并且本身也没有定量的含义,在实际应用中C的取值往往很难取舍.因此Scholkopf等人于2000年利用参数v代替C提出了v-支持向量分类机(v-SVC),通过替换,参数v值本身就含有一定的意义.本论文主要做了以下三方面的工作:(1)探究了v-SVC中参数v与总样本数f之间的关系.利用Markov不等式及其概率论相关知识,证明了参数v在满足一定条件下以概率1渐进逼近于支持向量个数和总样本数之比q/l;(2)研究了v-SVC与C-SVC中参数v与参数C之间的映射关系.从UCI数据库中下载:breast-cancer-wisconsin (diagnostic), iris, letter-recognition数据集,利用RStudio编程实现C-SVC并进行了数值实验.实验结果表明:训练样本集在选取非正定核函数下参数C与参数v的映射关系并不满足非增性;(3)研究了如何利用准确率和召回率选取最优参数v来获得最优分类器.从UCI数据库中下载balance-scale, breast-cancer-wisconsin (original), iris, letter-recognition, waveform这五个标准数据集,利用RStudio编程实现v-SVC并进行了实验,实验中选取数据的2/3作为训练数据,1/3作为测试数据,计算出取不同v值时的准确率和召回率以及相应的F-值.并依据F-值得到了在取不同核函数时的最优参数区间.实验结果表明:在得出的最优参数区间内,v-SVC保持了在训练集和测试集上较高的准确率和召回率.
【关键词】:v-支持向量分类机 核函数 混淆矩阵 准确率 召回率 F-值
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要6-8
- Abstract8-14
- 第一章 引言14-20
- 1.1 支持向量分类机的发展现状14-15
- 1.2 支持向量分类机的研究背景15-17
- 1.3 支持向量分类机相关概念17-20
- 第二章 C-支持向量分类机原理20-28
- 2.1 C-线性可分支持向量分类机20-21
- 2.2 C-线性支持向量分类机21-25
- 2.3 C-支持向量分类机25-28
- 第三章 v-支持向量分类机原理28-36
- 3.1 v-线性支持向量分类机28-29
- 3.2 v-支持向量分类机29-31
- 3.3 v-支持向量分类机的性质31-32
- 3.4 参数v与总样本数l的关系证明32-36
- 第四章 参数v和参数C关系的探究36-43
- 4.1 参数v与参数C的相关定理36-37
- 4.2 基于正定核下参数v与参数C的关系37-40
- 4.3 基于非正定核下参数v与参数C的关系40-43
- 第五章 最优参数v的选择43-52
- 5.1 评估分类器性能的度量43-45
- 5.2 最优参数v的选择45-52
- 5.2.1 基于正定核linear下最优参数v的选择46-47
- 5.2.2 基于正定核radial下最优参数v的选择47-48
- 5.2.3 基于非正定核Sigmoid下最优参数v的选择48-50
- 5.2.4 最优参数v的选择结果50-52
- 第六章 总结与展望52-54
- 参考文献54-58
- 附录58-65
- 致谢65
【参考文献】
中国硕士学位论文全文数据库 前1条
1 沈丽静;ν-支持向量分类机在心肌梗塞疾病诊断中的应用[D];华东师范大学;2014年
本文关键词:V-支持向量分类机中若干问题的研究,由笔耕文化传播整理发布。
本文编号:303782
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/303782.html