一种基于SVM的降维方法在三类ROC分析中的应用
本文关键词:一种基于SVM的降维方法在三类ROC分析中的应用,,由笔耕文化传播整理发布。
【摘要】:随着人工智能、大数据等技术的快速发展,机器学习迎来了发展的春天。机器学习是一门多领域的交叉学科,是人工智能研究的核心领域,不管是在工业界,还是在学术界都大家研究的热点。机器学习理论主要目的是设计出一些算法使计算机具备自我学习的能力,通过训练集获取模型,并利用此模型对未知的训练集样本进行预测,在很多领域已经达到甚至超越了人类的水平。在传统的机器学习技术中,都是在假设样本具有相同的类分布,且两类错误代价相同的前提下的,而实际应用中数据往往是不平衡分布的,错误代价也是存在着天壤之别的。为了推动机器学习技术的进一步发展,我们必须重新审视传统机器学习中的局限性,而衡量机器学习算法的优劣的标准是我们优先考虑的方向,也就是ROC分析技术。目前ROC分析技术已经广泛应用到了生物医学、信号处理、机器学习等领域,但主要应用在两类问题中,在多类问题上,ROC面临着高维空间、表示困难、难以理解等问题。本文的主要目标是提出一种新的三分类分类器性能比较方法,用ROC曲面下的体积来比较三分类分类器的性能,从而有效的拓展ROC分析技术在三分类问题上的应用。本文需要解决的主要问题是实现数据的降维、形成ROC曲面以及求得ROC曲面下体积的大小。本文以支持向量机为分类工具,采用“一对余”的分类方式对三类数据进行分类,得到三个一维的数值,然后以三个分类结果为坐标轴建立空间坐标系,然后在此基础上进行数据的降维,先将数据投影到一个三维空间平面,再将三维空间平面上的数据映射到了二维空间。通过直角支架以一定的步数遍历二维空间上的样本点,支架每到一个位置都会得到一个三维的点,所有的这些点就构成了所要三维ROC曲面。最后使用分块求体积的方式求得ROC曲面下的体积,将ROC曲面分成若干个小的三棱柱,每一个小的三棱柱又可以分为三个小的三棱锥。最后,本文通过仿真数据集实验和真实数据集实验,结果充分验证了本文方法的可靠性和优越性,和传统的三类ROC分析技术相比,本文方法避免了空间的高维化,具有容易表达,易于理解等优点,和非参数法相比,本文所用体积法求VUS具有计算复杂度低的优点。
【关键词】:支持向量机(SVM) 接收机工作特性(ROC) 降维 曲面下的体积(VUS)
【学位授予单位】:广东工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要4-5
- Abstract5-13
- 第一章 绪论13-19
- 1.1 研究背景13-16
- 1.2 选题的意义和研究现状16-17
- 1.2.1 将ROC分析方法推广到三类中的意义16
- 1.2.2 ROC分析方法国内外的研究现状16-17
- 1.3 本文主要研究内容17-18
- 1.4 本章小结18-19
- 第二章 ROC介绍19-33
- 2.1 分类器的评价19-20
- 2.1.1 分类算法的衡量标准19
- 2.1.2 用正确率衡量分类算法的局限性19-20
- 2.2 ROC介绍20-30
- 2.2.1 ROC基础20-23
- 2.2.2 使用ROC图评价分类器23-28
- 2.2.3 ROC曲线下的面积28-30
- 2.3 ROC在多类中的应用30-32
- 2.4 本章小结32-33
- 第三章 支持向量机理论33-54
- 3.1 引言33
- 3.2 统计学习理论33-38
- 3.2.1 分类问题的统计学提法33-34
- 3.2.2 经验风险最小化原则34-35
- 3.2.3 VC维35-36
- 3.2.4 结构风险最小化原则36-38
- 3.3 线性支持向量机38-45
- 3.3.1 线性可分问题最大间隔法38-40
- 3.3.2 线性可分问题的支持向量机40-42
- 3.3.3 线性支持向量分类机42-45
- 3.4 支持向量机45-49
- 3.4.1 线性不可分问题转化为线性可分问题45-46
- 3.4.2 非线性分类支持向量分类机46-47
- 3.4.3 核函数47-48
- 3.4.4 标准支持向量机48-49
- 3.5 支持向量机在多分类中的应用举例49-53
- 3.5.1 一对多49-50
- 3.5.2 一对一50
- 3.5.3 一次性求解50
- 3.5.4 决策有向无环图50-51
- 3.5.5 “纠错编码”方法51-52
- 3.5.6 “二叉树”方法52-53
- 3.6 本章小结53-54
- 第四章 算法部分54-63
- 4.1 使用SVM分类器对样本进行分类54
- 4.2 数据降维的实现54-58
- 4.2.1 建立空间坐标系54-55
- 4.2.2 三维空间向二维空间的转换55-58
- 4.3 遍历二维平面得到ROC曲面58-60
- 4.3.1 支架的转换58-59
- 4.3.2 遍历平面上的样本59-60
- 4.4 计算ROC曲面下的体积60-61
- 4.5 非参数法估计VUS均值的大小61
- 4.6 本章小结61-63
- 第五章 实验验证及分析63-69
- 5.1 实验一:VUS和类间距的关系验证63-64
- 5.2 实验二:验证步数对体积的影响64
- 5.3 实验三:体积法和非参数法对比64-65
- 5.4 实验四:体积法的时间成本与步数的变化关系65-66
- 5.5 实验五:体积法和非参数法时间复杂度对比66
- 5.6 实验六:IRIS(鸢尾花)数据集测试66-68
- 5.7 本章小结68-69
- 总结与展望69-71
- 参考文献71-77
- 攻读硕士学位期间取得的研究成果77-79
- 致谢79
【参考文献】
中国期刊全文数据库 前10条
1 刘学谦;于宏毅;;SVM在通信信号处理中的研究与应用[J];信息工程大学学报;2013年06期
2 饶刚;刘琼荪;高君健;;基于灰色特征加权支持向量机的二维函数拟合[J];计算机工程与设计;2012年10期
3 包健;刘然;;用纠错编码改进的M-ary支持向量机多类分类算法[J];计算机应用;2012年03期
4 潘清;陈卉;马宇晶;沙飞;;影像学诊断评价中的参数法ROC曲线分析[J];中国医学影像技术;2011年08期
5 王艳;陈欢欢;沈毅;;有向无环图的多类支持向量机分类算法[J];电机与控制学报;2011年04期
6 刘健;刘忠;熊鹰;;改进的二叉树支持向量机多类分类算法研究[J];计算机工程与应用;2010年33期
7 武优西;郭磊;柴欣;王岩;;基于优化算法的核函数参数选择的研究[J];计算机应用与软件;2010年01期
8 韩毅;周晏;;基于SVM的Web文本分类[J];科技信息;2009年17期
9 王晓锋;秦玉平;;一种新型基于二叉树的支持向量机多类分类方法[J];郑州轻工业学院学报(自然科学版);2008年06期
10 黄剑锋;刘付显;朱法顺;;基于多类分类支持向量机的空袭目标识别[J];微计算机信息;2008年10期
中国硕士学位论文全文数据库 前7条
1 李玉朵;基于SVM的人脸表情识别研究[D];河北工程大学;2012年
2 谢福民;基于支持向量机的软测量方法及其应用研究[D];江西理工大学;2011年
3 孙庆嘉;多类支持向量机的研究与分析[D];北京交通大学;2010年
4 陈鸣;序列数据多分类问题的研究与实现[D];复旦大学;2010年
5 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
6 董钢;支持向量机建模方法的研究[D];东北大学;2008年
7 何凯;支持向量机方法在智能医疗诊断系统中的应用与研究[D];浙江大学;2007年
本文关键词:一种基于SVM的降维方法在三类ROC分析中的应用,由笔耕文化传播整理发布。
本文编号:392153
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/392153.html