多核一类支持向量机方法研究

发布时间:2020-11-05 01:04
   异常检测问题是现实生活中一类迫切需要解决的问题,其已成为机器学习、深度学习领域的研究热点。异常检测实质是一种类别极不平衡的单类分类问题,目前,关于单类分类方法的研究已呈现出百家争鸣的现象,其中,广受学者青睐的是基于支持向量的方法——一类支持向量机(one-class support vector machine,OCSVM)和支持向量数据描述(support vector data description,SVDD)。该方法主要通过对目标类数据学习,构造一个最优的围绕目标类的边界,达到以高精度识别异常数据的目的。随着该类方法的广泛应用,传统的一类支持向量机算法的弊端逐渐显露。一是算法中使用的核函数及其核参数难以确定,且未有一个通用的确定方法,但是算法的性能很大程度上取决于所使用的核函数及其参数,因此一类支持向量机中核函数及其参数的选择是该算法的一个核心问题。二是算法对于训练集中的离群点或者噪音相当敏感,鲁棒性差。基于上述问题,本文围绕一类支持向量机算法展开研究,主要工作及取得的成果如下:1.将多核学习与一类支持向量机相结合,提出了基于核对齐的多核一类支持向量机。该方法将传统模型中的单核函数替换为多核函数,并以优化核对齐模型的方法计算出各基本核的权重,进而构造所需的线性加权合成核,避免选择最优的核函数及其参数这一难题。仿真实验结果表明,该方法的分类表现优于传统交叉验证选参的方法,并且训练效率明显提高。2.将模糊隶属度引入到多核一类支持向量机中,提出了基于核对齐的模糊多核一类支持向量机。该方法利用训练集中样本的类别确定性不同,为每个样本赋予一个模糊隶属度,降低噪音或离群点对分类边界产生的负面影响;同时使用基于核对齐的多核模型替代单核。在人工数据集和标准数据集上与其他两种算法进行了实验比较,结果表明所提方法具有抗噪性,提高了一类支持向量机的鲁棒性,并且计算效率高。3.基于数据的局部密度,提出了一种新的样本隶属度计算方法。该方法利用核函数衡量样本间的局部相似性大小,并确定样本的局部密度信息,然后依据局部密度赋予样本不同的隶属度。与其他隶属度方法相比,在基于局部密度的隶属度的计算过程中,仅需使用目标数据,这与一类支持向量机的训练集一致。将该隶属度计算方法与模糊多核一类支持向量机模型结合,并在标准数据集上进行了仿真实验,与多核一类支持向量机、加权多核一类支持向量机、基于核对齐的模糊多核一类支持向量机相比,该方法具有更优的抗噪能力。
【学位单位】:北京建筑大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:TP181
【部分图文】:

训练时间


1 Hepatitis 69.33±5.01 69.62±4.02 41.61±0.03 5.86±0.02 2 Cancer 94.94±1.32 95.20±1.23 136.74±0.02 29.51±0.02 3 Heart 72.96±3.57 71.62±2.78 75.20±0.02 6.64±0.02 4 Wdbc 90.47±1.78 88.60±1.50 188.30±0.01 17.38±0.02 5 Glass 91.98±3.79 91.22±1.71 15.58±0.01 2.55±0.01 6 Parkinsons 67.70±2.04 68.03±2.40 46.22±0.01 6.11±0.01 7 Wholesale Customers 83.58±3.04 85.19±1.61 27.16±0.01 5.88±0.01 8 Horse 63.69±1.83 64.38±2.95 148.97±0.01 9.73±0.02

训练时间,算法,数据集,支持向量机


第4章模糊多核一类支持向量机316Vowel(1)1248.7036.0641.447Waveform468.6414.9120.848Creditcard_cut1025.0038.5147.199Hepatitis56.827.416.1010Imports27.304.204.7611Iono189.8010.5310.1412Vowel(2)31.323.574.5813Wine18.431.311.4414Biomed34.955.436.1615Breast152.0132.8633.2416Park2615.2043.6550.31图4-4算法的平均训练时间对比Fig.4-4Comparisonofaveragetrainingtime从表4-3几何均值的实验结果来看,本章提出的基于核对齐的模糊多核支持向量机具有最佳的分类表现。对于16个实验数据集,FMKOCSVM算法在其中13个数据集上获得最高的几何均值。在某些数据集上,FMKOCSVM算法的优势更加明显,例如:在Australia、Glass、Japan、Vowel(1)、Creditcard_cut数据集上,FMKOCSVM算法的结果比OCSVM要高11%~27%,其他数据上的分类性能也有近4%左右的提高。FMKOCSVM算法与MKOCSVM算法相比,在Australia、Japan、Vowel(1)、Creditcard_cut、Breast、Park数据集上的几何均值结果提高了9%~21%左右,另外,在其他3个数据集

训练时间,支持向量机,数据集


第4章模糊多核一类支持向量机40表4-10训练时间对比Table4-10Comparisonoftrainingtime编号数据集训练时间(平均值(秒))MKOCSVMWMKOCSVMFMKOCSVMFMKOCSVM_D1Australia20.6048.6522.6728.222Balancescaleleft13.1330.3016.8519.343Biomed5.4312.756.167.684Glass1.525.313.172.925Heart7.7517.877.969.646Vowel3.575.114.582.957Wine1.314.891.443.218Creditcard_cut38.5175.9347.1954.969Japan18.8144.1820.3024.4210Iris1.224.221.701.8811Breast32.8651.2733.2447.5812Wdbc18.7145.8923.8628.2613Pima38.4968.9451.4257.0814Waveform14.9137.2020.8421.97图4-814个数据集上的总训练时间Fig.4-8Thetotaltrainingtimeof14datasets
【参考文献】

相关期刊论文 前5条

1 丁世飞;齐丙娟;谭红艳;;支持向量机理论与算法研究综述[J];电子科技大学学报;2011年01期

2 汪洪桥;孙富春;蔡艳宁;陈宁;丁林阁;;多核学习方法[J];自动化学报;2010年08期

3 郭虎升;亓慧;王文剑;;处理非平衡数据的粒度SVM学习算法[J];计算机工程;2010年02期

4 潘志松;陈斌;缪志敏;倪桂强;;One-Class分类器研究[J];电子学报;2009年11期

5 潘志松;倪桂强;谭琳;胡谷雨;;异常检测中单类分类算法和免疫框架设计[J];南京理工大学学报(自然科学版);2006年01期


相关硕士学位论文 前3条

1 潘丽平;模糊粗糙集模型及其数据挖掘方法研究[D];中国民航大学;2017年

2 张健;剪枝和网格采样相结合的非平衡数据集分类方法[D];安徽大学;2012年

3 朱靖;基于粗糙集和模糊集理论的属性约简算法研究[D];湖南大学;2008年



本文编号:2870877

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2870877.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2e97d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com