偏移类中心的自调整模糊支持向量机算法研究
发布时间:2021-10-26 17:06
支持向量机(Support Vector Machine,SVM)作为一种优良的机器学习算法,已被人们大量应用于工业生产、生活应用当中。但是,SVM存在着不能处理带有模糊信息、以及对噪声敏感的特性,因此学者们期望通过引入模糊支持向量机(Fuzzy Support Vector Machine,FSVM)来解决以上问题。FSVM对SVM的改进是通过对样本数据集特性的分析得到隶属度函数(Membership Function,MBSF),通过MBSF为每个样本赋予隶属度(Membership,MBS)。因此FSVM算法的核心在于如何构造良好的MBSF。根据MBSF构造的不同学者们提出大体可分为两类FSVM模型:基于样本和和类中心距离(Distance between Sample and Class Center,DSC)设计 MBSF 的 FSVM 和基于样本和类中心超平面距离(Distance Between Sample and Class Center Hyperplane,DSCH)设计 MBSF的FSVM。基于DSC设计MlBS的FSVM作为最先提出的算法以其简单易于操作的特点...
【文章来源】:安徽理工大学安徽省
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图2.2核函数??Fig?2.2?Kernel?function??在高维空间中可以通过使用线性分类算法,但是我们需要将二次规划问题中的x,"'使??
比如对类中心而言应该是样本的平均值[47M,若做一个与分类超平面平行且过这个类中心??的平面那么样本应在这个超平面的附近均匀分布。但是,核函数参数选取不当可能会使得??样本在超平面附近处于极度不均匀的情况,甚至样本只在超平面的一侧分布,如图3.2所??示。这样势必会影响FSVM的分类效果。因此,我们需要通过选取合适的核函数以及良好??的算法来避免这种分布不均匀的情况。??|?▲▲▲//???|??▲?〇1?/?^??|?▲▲/????|??图3.2核参数对样本空间分布影响示意图??Fig?3.2?Schematic?diagram?of?the?influence?of?nuclear?parameters?on?the?spatial?distribution?of??samples??2.在构造最小超球时,一般将使用样本到类中心最远距离的样本点作为得到最小超球??的半径,而在构造MBSF时,这个半径又将作为分母直接参与到运算,若是这个分母过大??或者过小都会使的样本的整体MBS偏大或偏小也会影响分类超平面的构造,从而影响分??类效率。比如,如果存在着一个样本点距离类中心距离远比“正常”样本点到类中心距离大,??那么我们理论上可以认为该样本点可能为噪声或野值点,但是,如果我们直接将这个样本??到类中心距离作为最小超球的半径就会出现超球半径过大,从而导致样本整体MBS偏小??的问题
比如对类中心而言应该是样本的平均值[47M,若做一个与分类超平面平行且过这个类中心??的平面那么样本应在这个超平面的附近均匀分布。但是,核函数参数选取不当可能会使得??样本在超平面附近处于极度不均匀的情况,甚至样本只在超平面的一侧分布,如图3.2所??示。这样势必会影响FSVM的分类效果。因此,我们需要通过选取合适的核函数以及良好??的算法来避免这种分布不均匀的情况。??|?▲▲▲//???|??▲?〇1?/?^??|?▲▲/????|??图3.2核参数对样本空间分布影响示意图??Fig?3.2?Schematic?diagram?of?the?influence?of?nuclear?parameters?on?the?spatial?distribution?of??samples??2.在构造最小超球时,一般将使用样本到类中心最远距离的样本点作为得到最小超球??的半径,而在构造MBSF时,这个半径又将作为分母直接参与到运算,若是这个分母过大??或者过小都会使的样本的整体MBS偏大或偏小也会影响分类超平面的构造,从而影响分??类效率。比如,如果存在着一个样本点距离类中心距离远比“正常”样本点到类中心距离大,??那么我们理论上可以认为该样本点可能为噪声或野值点,但是,如果我们直接将这个样本??到类中心距离作为最小超球的半径就会出现超球半径过大,从而导致样本整体MBS偏小??的问题
【参考文献】:
期刊论文
[1]基于局部二进制和支持向量机的手写体数字识别[J]. 郭伟林,邓洪敏,石雨鑫. 计算机应用. 2018(S2)
[2]基于压缩K近邻边界向量的支持向量预抽取算法[J]. 王石,蒋宁宁,杨舒卉. 海军工程大学学报. 2018(06)
[3]基于聚类标签均值的半监督支持向量机[J]. 田勋,汪西莉. 计算机工程与科学. 2018(12)
[4]基于模糊信息粒化和支持向量机的股票价格回归预测[J]. 郑明,李娌芝,官心果,杨柱元. 云南民族大学学报(自然科学版). 2018(06)
[5]改进的FSVM算法用于非平衡情感数据分类[J]. 张雪英,张波,陈桂军. 计算机工程与设计. 2018(11)
[6]基于模糊支持向量机的软件缺陷预测技术[J]. 程元启,姚淑珍,谭火彬,李丹丹. 计算机工程与设计. 2018(09)
[7]基于类内超平面距离度量模糊支持向量机的语音情感识别[J]. 张波,张雪英,陈桂军,孙颖. 现代电子技术. 2018(16)
[8]FSVM模糊隶属度改进和信息熵融合的复杂设备故障分析[J]. 王宇凡,董仲慧. 西安工业大学学报. 2017(11)
[9]机器学习在甲状腺肿瘤诊疗中的应用[J]. 张婷婷,渠宁,郑璞,陈雅玲,史荣亮,嵇庆海,孙国华. 中国癌症杂志. 2017(12)
[10]基于遗传算法优化BP神经网络的交通流预测[J]. 赵怀柏,王逸凡,宋晓鹏. 交通与运输(学术版). 2017(02)
博士论文
[1]数据分类的贝叶斯模糊学习和基于凸包的快速学习方法研究[D]. 顾晓清.江南大学 2017
本文编号:3459877
【文章来源】:安徽理工大学安徽省
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图2.2核函数??Fig?2.2?Kernel?function??在高维空间中可以通过使用线性分类算法,但是我们需要将二次规划问题中的x,"'使??
比如对类中心而言应该是样本的平均值[47M,若做一个与分类超平面平行且过这个类中心??的平面那么样本应在这个超平面的附近均匀分布。但是,核函数参数选取不当可能会使得??样本在超平面附近处于极度不均匀的情况,甚至样本只在超平面的一侧分布,如图3.2所??示。这样势必会影响FSVM的分类效果。因此,我们需要通过选取合适的核函数以及良好??的算法来避免这种分布不均匀的情况。??|?▲▲▲//???|??▲?〇1?/?^??|?▲▲/????|??图3.2核参数对样本空间分布影响示意图??Fig?3.2?Schematic?diagram?of?the?influence?of?nuclear?parameters?on?the?spatial?distribution?of??samples??2.在构造最小超球时,一般将使用样本到类中心最远距离的样本点作为得到最小超球??的半径,而在构造MBSF时,这个半径又将作为分母直接参与到运算,若是这个分母过大??或者过小都会使的样本的整体MBS偏大或偏小也会影响分类超平面的构造,从而影响分??类效率。比如,如果存在着一个样本点距离类中心距离远比“正常”样本点到类中心距离大,??那么我们理论上可以认为该样本点可能为噪声或野值点,但是,如果我们直接将这个样本??到类中心距离作为最小超球的半径就会出现超球半径过大,从而导致样本整体MBS偏小??的问题
比如对类中心而言应该是样本的平均值[47M,若做一个与分类超平面平行且过这个类中心??的平面那么样本应在这个超平面的附近均匀分布。但是,核函数参数选取不当可能会使得??样本在超平面附近处于极度不均匀的情况,甚至样本只在超平面的一侧分布,如图3.2所??示。这样势必会影响FSVM的分类效果。因此,我们需要通过选取合适的核函数以及良好??的算法来避免这种分布不均匀的情况。??|?▲▲▲//???|??▲?〇1?/?^??|?▲▲/????|??图3.2核参数对样本空间分布影响示意图??Fig?3.2?Schematic?diagram?of?the?influence?of?nuclear?parameters?on?the?spatial?distribution?of??samples??2.在构造最小超球时,一般将使用样本到类中心最远距离的样本点作为得到最小超球??的半径,而在构造MBSF时,这个半径又将作为分母直接参与到运算,若是这个分母过大??或者过小都会使的样本的整体MBS偏大或偏小也会影响分类超平面的构造,从而影响分??类效率。比如,如果存在着一个样本点距离类中心距离远比“正常”样本点到类中心距离大,??那么我们理论上可以认为该样本点可能为噪声或野值点,但是,如果我们直接将这个样本??到类中心距离作为最小超球的半径就会出现超球半径过大,从而导致样本整体MBS偏小??的问题
【参考文献】:
期刊论文
[1]基于局部二进制和支持向量机的手写体数字识别[J]. 郭伟林,邓洪敏,石雨鑫. 计算机应用. 2018(S2)
[2]基于压缩K近邻边界向量的支持向量预抽取算法[J]. 王石,蒋宁宁,杨舒卉. 海军工程大学学报. 2018(06)
[3]基于聚类标签均值的半监督支持向量机[J]. 田勋,汪西莉. 计算机工程与科学. 2018(12)
[4]基于模糊信息粒化和支持向量机的股票价格回归预测[J]. 郑明,李娌芝,官心果,杨柱元. 云南民族大学学报(自然科学版). 2018(06)
[5]改进的FSVM算法用于非平衡情感数据分类[J]. 张雪英,张波,陈桂军. 计算机工程与设计. 2018(11)
[6]基于模糊支持向量机的软件缺陷预测技术[J]. 程元启,姚淑珍,谭火彬,李丹丹. 计算机工程与设计. 2018(09)
[7]基于类内超平面距离度量模糊支持向量机的语音情感识别[J]. 张波,张雪英,陈桂军,孙颖. 现代电子技术. 2018(16)
[8]FSVM模糊隶属度改进和信息熵融合的复杂设备故障分析[J]. 王宇凡,董仲慧. 西安工业大学学报. 2017(11)
[9]机器学习在甲状腺肿瘤诊疗中的应用[J]. 张婷婷,渠宁,郑璞,陈雅玲,史荣亮,嵇庆海,孙国华. 中国癌症杂志. 2017(12)
[10]基于遗传算法优化BP神经网络的交通流预测[J]. 赵怀柏,王逸凡,宋晓鹏. 交通与运输(学术版). 2017(02)
博士论文
[1]数据分类的贝叶斯模糊学习和基于凸包的快速学习方法研究[D]. 顾晓清.江南大学 2017
本文编号:3459877
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3459877.html