基于组合凸线器的多类分类方法研究
发布时间:2021-03-10 03:36
随着互联网、计算机技术的快速发展以及智能手机的普及,人们生活更加数字化和智能化,与此同时,各种文本或日志数据等在爆炸式地增长。如何快速地对这些数据进行有效分类并从中挖掘出有用的价值信息逐渐成为人们日益关心的问题。自动分类技术已经成为机器学习领域的研究热点,因为它能快速地进行分类,减少人工进行分类的成本,提高工作效率。针对样本类别数较少、数据量较大的多类分类问题,提出了一种基于1-a-1和组合凸线器的多类分类算法。该算法对于有N个类别的训练样本,用1-a-1的方法训练N(N-1)/2个组合凸线器二分类器,对于每一个待分类样本,用所有的二分类器去进行分类,最终根据每个类别所得的票数决定所属类别。在Reuters 21578数据集上进行的分类实验结果表明,相对于支持向量机1-a-1算法,本文算法在保证分类精度和训练速度的同时,分类速度有了显著提高。针对样本类别数较多、数据量较少的多类分类问题,提出了一种基于1-a-r和组合凸显器方法的多类分类算法。该算法对于有N个类别的训练样本,采用一对其余的方法训练N个组合凸线器二分类器,对于每一个待分类样本,用所有的二分类器去进行分类,最终根据样本的票数...
【文章来源】:渤海大学辽宁省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
图2-1最优超平面??
图2-2软间隔SVMs的几何解释??
?潮海大学硕士学位论文???一个高维特征空间,在低维样本空间中需要学习的是超曲面模型,但是映射到高维空间后,??需要学习的是超平面模型。如图2-3所示。这样,分类学习任务通过在特征空间中求解线??性支持向量机就可以完成。??样本空间?个Z3?特征空间??XI????'滅、?.??參?春?21????????x2?Z2,,??图2-3样本空间到特征空间的非线性映射??线性支持向量机式(2-10)的对偶问题为??j?N?N?N??min??a?^?/=i?y=i?/=i??N??s-t.?'少,=0??/=1??0?<??,?<?C?,?i?=?U,…,N?(2-15)??求解该对偶问题的最优解a*?=?和w_?=乞,选择a*的一个分量a;适合??条件0<〇;)<。,计算^/=>^-艺>|乂(\:,.1,),分离超平面浓'.1:?+?^/?=?0等价于??Za,V,(x.x,)?+?Z>*=0?(2-16)??/=1??和分类决策函数;(:?+?/:/)等价于??〔N?、??f(x)?=?sign?YJa'y,{x'x,)+b,■?(2_17)??V,=i?7??观察可知,在式(2-15)的对偶问题中的目标函数和式(2-17)的决策函数中,都仅仅是??涉及到输入样本之间的内积计算,因此,如果用核函数XU,x,)?=?)??)来代替内积,??上述对偶问题中的目标函数就变成??min?(2_18)??a?^?;=1?y=l?/=1??同样分类决策函数变成??11??
【参考文献】:
期刊论文
[1]Hadamard纠错码结合支持向量机在多分类问题中的应用[J]. 尹安容,谢湘,匡镜明. 电子学报. 2008(01)
[2]贝叶斯学习、贝叶斯网络与数据采掘[J]. 林士敏,田凤占,陆玉昌. 计算机科学. 2000(10)
[3]文语转换系统中基于语料的汉语自动分词研究[J]. 应志伟,柴佩琪,陈其晖. 计算机应用. 2000(02)
博士论文
[1]组合凸线器框架下分片线性分类器的构造方法研究[D]. 冷强奎.北京工业大学 2015
[2]基于支持向量机的文本分类算法研究[D]. 秦玉平.大连理工大学 2008
本文编号:3073987
【文章来源】:渤海大学辽宁省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
图2-1最优超平面??
图2-2软间隔SVMs的几何解释??
?潮海大学硕士学位论文???一个高维特征空间,在低维样本空间中需要学习的是超曲面模型,但是映射到高维空间后,??需要学习的是超平面模型。如图2-3所示。这样,分类学习任务通过在特征空间中求解线??性支持向量机就可以完成。??样本空间?个Z3?特征空间??XI????'滅、?.??參?春?21????????x2?Z2,,??图2-3样本空间到特征空间的非线性映射??线性支持向量机式(2-10)的对偶问题为??j?N?N?N??min??a?^?/=i?y=i?/=i??N??s-t.?'少,=0??/=1??0?<??,?<?C?,?i?=?U,…,N?(2-15)??求解该对偶问题的最优解a*?=?和w_?=乞,选择a*的一个分量a;适合??条件0<〇;)<。,计算^/=>^-艺>|乂(\:,.1,),分离超平面浓'.1:?+?^/?=?0等价于??Za,V,(x.x,)?+?Z>*=0?(2-16)??/=1??和分类决策函数;(:?+?/:/)等价于??〔N?、??f(x)?=?sign?YJa'y,{x'x,)+b,■?(2_17)??V,=i?7??观察可知,在式(2-15)的对偶问题中的目标函数和式(2-17)的决策函数中,都仅仅是??涉及到输入样本之间的内积计算,因此,如果用核函数XU,x,)?=?)??)来代替内积,??上述对偶问题中的目标函数就变成??min?(2_18)??a?^?;=1?y=l?/=1??同样分类决策函数变成??11??
【参考文献】:
期刊论文
[1]Hadamard纠错码结合支持向量机在多分类问题中的应用[J]. 尹安容,谢湘,匡镜明. 电子学报. 2008(01)
[2]贝叶斯学习、贝叶斯网络与数据采掘[J]. 林士敏,田凤占,陆玉昌. 计算机科学. 2000(10)
[3]文语转换系统中基于语料的汉语自动分词研究[J]. 应志伟,柴佩琪,陈其晖. 计算机应用. 2000(02)
博士论文
[1]组合凸线器框架下分片线性分类器的构造方法研究[D]. 冷强奎.北京工业大学 2015
[2]基于支持向量机的文本分类算法研究[D]. 秦玉平.大连理工大学 2008
本文编号:3073987
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3073987.html