当前位置:主页 > 科技论文 > 自动化论文 >

面向噪声分类的非平行支持向量机模型研究

发布时间:2020-07-02 15:54
【摘要】:从支持向量机到非平行支持向量机的研究,近几年引起广泛关注。支持向量机主要是寻找一对平行超平面,并且使这两个平行超平面的间隔尽可能的大。而非平行支持向量机旨在为每类数据构造一个最优的超平面,构造的超平面并没有平行这个限定,并且期望每个超平面能够靠近本类数据,而远离其他类数据。非平行支持向量机解决了传统支持向量机面临的两个问题,一个是解不等式二次规划需要的高计算复杂度,另一个就是求解异或问题,而且非平行支持向量机对不同类型的数据有较好的分类能力。在一些具有噪声的数据中,噪声会降低决策函数的泛化能力,容易引起过拟合,影响其分类性能。非平行支持向量机主要考虑从损失函数和数据结构出发,提高其分类性能。因此,本文在非平行支持向量机的基础上提出了不同模型的非平行支持向量机模型。本文主要分为以下两个主要研究内容:一方面,从支持向量机的角度出发,利用不同的损失函数构造出不同的非平行支持向量机模型。该模型引入了新的软间隔损失函数,可以适用于不同类型的数据;这个新的非平行支持向量机可以退化为标准的支持向量机模型,这样该模型的计算方法和支持向量机的计算方法是一样的;把具有稀疏性的损失函数加入到非平行支持向量机中,既保持了稀疏特性,有可以适应不同类型的交叉数据。通过大量的公共数据集实验验证了其有效性。另一方面,两个优秀的非平行支持向量机模型:广义特征值近端支持向量机(Proximal Support Vector Machinevia Generalized Eigenvalues,GEPSVM)及其改进的广义特征值近端支持向量机(Improved Generalized Eigenvalue Proximal Support Vector Machine,IGEPSVM),它们具有良好的推广性能,但是,在实际应用中它们也有一些缺陷。首先,GEPSVM和IGEPSVM中得经验风险是用L_(2-)范数计算的,L_2-范数中使用的是平方距离,对噪声和异常值具有敏感性,降低了其分类性能。其实上述两种非平行支持向量机并没有考虑数据的相关结构,当数据高度相关时,其分类能力降低。为了缓解上述问题,本文提出了一种用于噪声分类的迹模正则化鲁棒近端支持向量机(Robust Nonparallel Proximal Support Vector Machine,RNPSVM),在IGEPSVM的基础上,把L_2-范数改为L_1-范数,L_1-范数是用绝对值之和来衡量的,降低了对噪声的敏感性,旨在最大化L_1-范数的类间距离的同时,最小化L_(1-)范数的类内距离,使其对异常值具有鲁棒性;通过考虑数据的相关性,引入了迹模(基于训练数据的自适应模)惩罚项,这个迹模惩罚项不仅具有稀疏性,在数据相关度较高时其分类性能也是很好。在GEPSVMs中可能遇到奇异值问题,通过修改模型可以避免出现奇异值问题;最后提出了一种有效的迭代算法,并且验证了其收敛性。在合成和现实噪声数据集上的广泛实验结果验证了RNPSVM的有效性。
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP181
【图文】:

示意图,示意图,松弛变量,罚参数


图 2-1 最大间隔几何示意图Figure 2-1 Maximum spacing geometry向量,通过适当的法向量会求出这样两条支持但是也有一些线性不可分数据集,这样针对上线,那么就引入松弛变量:0, 1,...,i i m为:2, ,1ii1min || w ||2. . y ((w ) ) 1 , 1,...,0, 1,...,miw bii iCs t x b i mi m 罚参数,加入松弛变量的优化问题就意味着允多数的样本点被正确分类,既要求两支持直线间

损失函数,不敏感,函数,最优化问题


18(a) (b)图3-1 (a)本章提出的软间隔 -不敏感损失函数和软间隔损失函数(b)软间隔损失和最小二乘损失函数Figure 3-1 (a) Soft interval - insensitive loss function and soft interval loss functionproposed in this chapter(b) Soft interval loss and least squares loss function从图3-1中可以明显看出,最小二乘损失函数不具有稀疏得特性,而支持向量机中的软间隔损失函数和本章提出的软间隔 -不敏感损失函数具有稀疏的特性,所以最小化模型(3-18)和(3-19)就具有稀疏的特性。与此同时,我们还可以得到如下定理:定理 3.2 当 0,且1 2C C时,最小化问题(3-18)和(3-19)就等价于支持向量机的原始优化问题(2-7)。证明:当 0时,最小化问题(3-18)中不等式*1 1 1 1(w ) 1i x b 是无用处,所以最优化问题可以改写为:1 1 111 221 1 2 1w , , ,1 1 1 1 11 1 1 1 21min || w ||2. . 1 (w ) , 0,1 (w ) , 0,i ii ibx T x Ti i i ii i i iC Cs t x b x Tx b x T (3-20)同样最优化问题(3-19)中不等式*2 2 2 2(w ) 1i i x b 也是无用处的

【相似文献】

相关期刊论文 前10条

1 马旭霞;;支持向量机理论及应用[J];科学技术创新;2019年02期

2 江少杰;宁纪锋;李云松;;加权间隔结构化支持向量机目标跟踪算法[J];中国图象图形学报;2017年09期

3 李娜;孙乐;胡一楠;李笑;王亚南;;模糊型支持向量机及其在入侵检测中的应用[J];科技创新与应用;2018年11期

4 邵元海;杨凯丽;刘明增;王震;李春娜;陈伟杰;;从支持向量机到非平行支持向量机[J];运筹学学报;2018年02期

5 高钦姣;张胜刚;贾晓薇;;基于支持向量机的股票价格预测模型研究与应用[J];课程教育研究;2016年28期

6 林香亮;袁瑞;孙玉秋;王超;陈长胜;;支持向量机的基本理论和研究进展[J];长江大学学报(自科版);2018年17期

7 安悦tD;丁世飞;胡继普;;孪生支持向量机综述[J];计算机科学;2018年11期

8 梁武;苏燕;;一种新的基于类内不平衡数据学习支持向量机算法[J];科技通报;2017年09期

9 吴青;梁勃;;分段熵光滑支持向量机性能研究[J];计算机工程与设计;2015年08期

10 牛r

本文编号:2738383


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2738383.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户699aa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com