改进的支持向量机的理论研究及应用
本文关键词:改进的支持向量机的理论研究及应用,由笔耕文化传播整理发布。
【摘要】:分类问题是机器学习和数据挖掘中经常遇到的重要问题,支持向量机模型是针对小样本分类问题提出来的,由于其极小化结构风险,避免维数灾难和核函数的巧妙结合等特点成为目前解决分类问题中最有效的机器学习算法之一.但传统的支持向量机模型的目标函数是单一的,产生一个分类超平面,当训练的样本数据过小时容易产生过拟合现象,且不适用于数据量较大的样本.为了改善上述情况,近几年出现了一些改进的支持向量机模型,本文主要是研究此类支持向量机模型的理论和应用.本文研究的内容主要有四部分.首先,从支持向量机模型中目标函数的个数不同,划分为单目标函数的支持向量机模型和双目标函数的支持向向量机模型.接着,进行理论分析:在单目标函数的支持向量机模型中,主要研究了最基本的支持向量机和C-支持向量机;在双目标函数的支持向量机中,重点研究了孪生支持向量(TWSVM)和非平行支持向量机(NPSVM),从理论上分析了传统的支持向量机模型和改进的支持向量机的区别和联系,并进一步指出了改进的支持向量机模型在理论上和实际应用中的优点和不足.然后,为了突出改进的支持向量机模型应用到分类问题的优点,本文对文本分类和情感分析两个分类问题进行试验,其中情感分析应用领域的研究是一个创新点.最后,为了拓宽研究思路,作者将支持向量机与深度学习做简要的对比.本文的主要结果如下:1.改进的支持向量机模型是产生两个分类超平面,使得同一类样本尽可能在同一个超平面内,并且尽可能远离另一类样本所在的超平面,从理论上比传统的支持向量机模型更能拟合数据的分布.2.改进的支持向量机将传统的支持向量机中的一个凸优化问题转化成两个小的凸优化问题来解决,从理论上分析得出改进的支持向量机模型的运行速度要比传统的支持向量机快将近4倍.3.从实验运行分类精度的结果来看,我们可以发现TWSVM和NPSVM在小样本数据以及样本数据较大的情况下要比传统的支持向量机的分类准确度要高1%至10%,且样本越大,差距越明显.4.从对同一标准数据集上,训练集所占的不同百分比分类精度结果所绘制的图来看,改进的支持向量机的稳定性和精度比传统的支持向量机具有明显的优势.5.支持向量机模型也是一种单层的神经网络,将深度学习的模型与支持向量机模型结合起来,可以结合两者的优点,在分类应用问题上会取得更好的分类效果.
【关键词】:分类问题 机器学习 支持向量机 双目标函数 深度学习
【学位授予单位】:西北农林科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 文献综述10-16
- 1.1 对所述研究方向研究背景和状况10-12
- 1.2 研究内容12-15
- 1.2.1 最原始的支持向量机12-13
- 1.2.2 C-支持向量机13
- 1.2.3 双目标函数的支持向量机13-14
- 1.2.4 支持向量机的应用14-15
- 1.2.5 深度学习15
- 1.3 小结15-16
- 第二章 改进的支持向量机模型16-37
- 2.1 准备知识16-21
- 2.1.1 分类问题的介绍16
- 2.1.2 VC维数16-17
- 2.1.3 结构风险最小化(Structural Risk Minimination)17-18
- 2.1.4 核函数18-20
- 2.1.5 损失函数20
- 2.1.6 KKT条件20-21
- 2.2 传统支持向量机的模型21-27
- 2.2.1 标准的支持向量机模型及求解过程21-24
- 2.2.2 C-SVM24-26
- 2.2.3 求解支持向量机算法SMO26-27
- 2.2.4 小结27
- 2.3 基于双目标函数的支持向量机27-36
- 2.3.1 孪生支持向量机(TWSVM)27-31
- 2.3.2 非平行支持向量机(NPSVM)31-36
- 2.4 小结36-37
- 第三章 改进的支持向量机的应用37-42
- 3.1 支持向量机在情感分析的应用37-39
- 3.1.1 情感分析的介绍37
- 3.1.2 数据的介绍37-38
- 3.1.3 实验过程38
- 3.1.4 实验结果及分析38-39
- 3.2 改进的支持向量机在文本分类中的应用39-41
- 3.2.1 文本分类的介绍39-40
- 3.2.2 数据类型的介绍40
- 3.2.3 实验过程40
- 3.2.4 实验结果和分析40-41
- 3.3 小结41-42
- 第四章 支持向量机和深度学习的简单对比42-46
- 4.1 深度学习的发展42-43
- 4.2 人工网络理论简单介绍43-44
- 4.3 两者之间在理论上的关系和应用领域的分析44-45
- 4.4 小结45-46
- 第五章 总结和展望46-47
- 参考文献47-50
- 附件50-63
- 致谢63-64
- 作者简介64
【相似文献】
中国期刊全文数据库 前10条
1 吴娟;范玉妹;王丽;;关于改进的支持向量机的研究[J];攀枝花学院学报;2006年05期
2 刘硕明;刘佳;杨海滨;;一种新的多类支持向量机算法[J];计算机应用;2008年S2期
3 尹传环;牟少敏;田盛丰;黄厚宽;;单类支持向量机的研究进展[J];计算机工程与应用;2012年12期
4 王云英;阎满富;;C-支持向量机及其改进[J];唐山师范学院学报;2012年05期
5 李逢焕;;试述不确定支持向量机应用分析及改进思路[J];中国证券期货;2012年12期
6 邵惠鹤;支持向量机理论及其应用[J];自动化博览;2003年S1期
7 曾嵘,蒋新华,刘建成;基于支持向量机的异常值检测的两种方法[J];信息技术;2004年05期
8 张凡,贺苏宁;模糊判决支持向量机在自动语种辨识中的研究[J];计算机工程与应用;2004年21期
9 魏玲,张文修;基于支持向量机集成的分类[J];计算机工程;2004年13期
10 沈翠华,邓乃扬,肖瑞彦;基于支持向量机的个人信用评估[J];计算机工程与应用;2004年23期
中国重要会议论文全文数据库 前10条
1 余乐安;姚潇;;基于中心化支持向量机的信用风险评估模型[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
2 刘希玉;徐志敏;段会川;;基于支持向量机的创新分类器[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
3 史晓涛;刘建丽;骆玉荣;;一种抗噪音的支持向量机学习方法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
4 何琴淑;刘信恩;肖世富;;基于支持向量机的系统辨识方法研究及应用[A];中国力学大会——2013论文摘要集[C];2013年
5 刘骏;;基于支持向量机方法的衢州降雪模型[A];第五届长三角气象科技论坛论文集[C];2008年
6 王婷;胡秀珍;;基于组合向量的支持向量机方法预测膜蛋白类型[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
7 赵晶;高隽;张旭东;谢昭;;支持向量机综述[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
8 周星宇;王思元;;智能数学与支持向量机[A];2005年中国智能自动化会议论文集[C];2005年
9 颜根廷;马广富;朱良宽;宋斌;;一种鲁棒支持向量机算法[A];2006中国控制与决策学术年会论文集[C];2006年
10 侯澍e,
本文编号:270231
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/270231.html