基于L2P范数距离度量的算法鲁棒性与稀疏性研究
发布时间:2020-12-22 04:41
传统模式识别算法中距离度量往往是基于平方L2范数距离度量。而在实际应用中平方L2范数距离度量往往会放大噪声数据在整体数据距离中占比,导致算法的鲁棒性较差。基于平方L2范数距离度量鲁棒性缺陷,本文在研究分类和特征选择问题时分别采用L2P范数距离和L21范数距离度量来提高算法的鲁棒性。孪生支持向量机(Twin Support Vector Machine)是一种特别适用于异或数据的有效分类器,通常基于平方L2范数距离度量来研究该分类器算法。由于平方L2范数距离度量容易受到异常值的影响,因此TWSVM需要一个更加有效的、鲁棒性强的距离度量。由于L2P范数距离度量比L1范数距离度量或平方L2范数距离度量能够更好地抑制异常值的影响,因此本文提出了一种基于L2P范数距离度量且鲁棒性强的孪生支持向量机。由于目标函数不光滑性和非凸性,基于L2P范数距离度量导致目标问题解决难度大。本文系统地给出一种有效的迭代算法,解决了基于L2P范数距离度量的目标最小化问题。理论研究证明了这个迭代算法基于L2P范数距离度量取代平方L2范数距离来改进TWSVM是有效的。实验表明,基于L2P范数距离度量的孪生支持向量机(p...
【文章来源】:南京林业大学江苏省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
异或数据实验分类平面
(传统 TWSVM) (L2P 范数距离 TWSVM)图 4-2: 存在野值的异或数据实验分类平面Fig.4-2 classfication surfaces on XOR data with noise data从图 4-2 中我们可以发现 TWSVM 和 L2P 范数距离 TWSVM 的分类表平面在结构的,并且 pTWSVM 提供了更好的分类效果。 这证明 pTWSVM 比 TWSVM 更不值影响,并且具有良好的鲁棒性。2 精度比较在本节中,本文收集了几种不同的公共数据集,以比较不同分类算法的性能。 了数据集的描述。表格 4-1 数据集描述Tab.4-1 Datasets Description数据集名称 样本个数 样本维度heart 270 13australian 690 14pima 768 8
图 4-3:不同 p 值下算法正确率折线图Fig.4-3: Accuracy line with different p4.4.4 算法收敛性分析由于该算法是一种迭代算法,因此算法的收敛性是一个重要的问题。 在前文中,从理论上严格证明了它的收敛性,现在从实验中研究它的收敛性。 本文用以下几个数据集进行试验,并且固定 p 值,算法在每次迭代中的目标值绘制在图 4-4 中。
【参考文献】:
期刊论文
[1]基于流行学习LPP算法与Dijkstra算法结合的交通路径控制研究[J]. 黄石青. 科技创新与应用. 2013(31)
[2]多分类最大间隔孪生支持向量机[J]. 高斌斌,王建军. 西南师范大学学报(自然科学版). 2013(10)
[3]基于近似零范数的稀疏核主成成分算法[J]. 谭龙,何改云,潘静,庞彦伟. 电子测量技术. 2013(09)
[4]改进孪生支持向量机的一种快速分类算法[J]. 高斌斌,刘霞,李秋林. 重庆理工大学学报(自然科学). 2012(11)
[5]L1范数正则化SVM聚类算法[J]. 刘建伟,李双成,付捷,罗雄麟. 计算机工程. 2012(12)
[6]基于L1范数凸包数据描述的多观测样本分类算法[J]. 胡正平,王玲丽. 电子与信息学报. 2012(01)
[7]一种模糊加权的孪生支持向量机算法[J]. 李凯,李娜,卢霄霞. 计算机工程与应用. 2013(04)
[8]基于简单特征值问题的修正GEPSVM[J]. 徐金宝,业巧林,业宁. 计算机工程. 2009(21)
[9]数据降维方法分析与研究[J]. 吴晓婷,闫德勤. 计算机应用研究. 2009(08)
[10]半监督型广义特征值最接近支持向量机[J]. 杨绪兵,潘志松,陈松灿. 模式识别与人工智能. 2009(03)
博士论文
[1]线性投影分析的理论与算法及其在特征抽取中的应用研究[D]. 杨健.南京理工大学 2002
本文编号:2931148
【文章来源】:南京林业大学江苏省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
异或数据实验分类平面
(传统 TWSVM) (L2P 范数距离 TWSVM)图 4-2: 存在野值的异或数据实验分类平面Fig.4-2 classfication surfaces on XOR data with noise data从图 4-2 中我们可以发现 TWSVM 和 L2P 范数距离 TWSVM 的分类表平面在结构的,并且 pTWSVM 提供了更好的分类效果。 这证明 pTWSVM 比 TWSVM 更不值影响,并且具有良好的鲁棒性。2 精度比较在本节中,本文收集了几种不同的公共数据集,以比较不同分类算法的性能。 了数据集的描述。表格 4-1 数据集描述Tab.4-1 Datasets Description数据集名称 样本个数 样本维度heart 270 13australian 690 14pima 768 8
图 4-3:不同 p 值下算法正确率折线图Fig.4-3: Accuracy line with different p4.4.4 算法收敛性分析由于该算法是一种迭代算法,因此算法的收敛性是一个重要的问题。 在前文中,从理论上严格证明了它的收敛性,现在从实验中研究它的收敛性。 本文用以下几个数据集进行试验,并且固定 p 值,算法在每次迭代中的目标值绘制在图 4-4 中。
【参考文献】:
期刊论文
[1]基于流行学习LPP算法与Dijkstra算法结合的交通路径控制研究[J]. 黄石青. 科技创新与应用. 2013(31)
[2]多分类最大间隔孪生支持向量机[J]. 高斌斌,王建军. 西南师范大学学报(自然科学版). 2013(10)
[3]基于近似零范数的稀疏核主成成分算法[J]. 谭龙,何改云,潘静,庞彦伟. 电子测量技术. 2013(09)
[4]改进孪生支持向量机的一种快速分类算法[J]. 高斌斌,刘霞,李秋林. 重庆理工大学学报(自然科学). 2012(11)
[5]L1范数正则化SVM聚类算法[J]. 刘建伟,李双成,付捷,罗雄麟. 计算机工程. 2012(12)
[6]基于L1范数凸包数据描述的多观测样本分类算法[J]. 胡正平,王玲丽. 电子与信息学报. 2012(01)
[7]一种模糊加权的孪生支持向量机算法[J]. 李凯,李娜,卢霄霞. 计算机工程与应用. 2013(04)
[8]基于简单特征值问题的修正GEPSVM[J]. 徐金宝,业巧林,业宁. 计算机工程. 2009(21)
[9]数据降维方法分析与研究[J]. 吴晓婷,闫德勤. 计算机应用研究. 2009(08)
[10]半监督型广义特征值最接近支持向量机[J]. 杨绪兵,潘志松,陈松灿. 模式识别与人工智能. 2009(03)
博士论文
[1]线性投影分析的理论与算法及其在特征抽取中的应用研究[D]. 杨健.南京理工大学 2002
本文编号:2931148
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2931148.html