当前位置:主页 > 管理论文 > 统计学论文 >

大样本的线性可分支持向量机算法

发布时间:2020-05-22 15:31
【摘要】:伴随产业界数据量的爆炸式增进,大数据概念的关注度也得到很大程度的提升。因为大数据的庞大、复杂多样等特征,传统的支持向量机分类算法在大数据环境下已不再实用。因而,大数据下支持向量机分类算法的研究成为各界密切关注的方向。为了能够将支持向量机应用于海量样本数据的快速分类,需要从大样本数据集中筛选潜在的支持向量集,以此作为SVM的训练集,提高学习效率。因为样本容量较大时,支持向量机的学习难度会增大,并且会消费大量的学习时间,这使得支持向量机在海量样本数据学习难以被采用。支持向量机的分离超平面是由支持向量所决定,其他训练样本点对分离超平面的确定完全不起作用。本文将大规模的数据缩减成小规模的数据,在小规模的数据上学习支持向量并进行迭代,得到最终的支持向量。本文提出了一种线性可分支持向量机分组算法,该算法将大样本随机分成若干组的小样本训练数据集,在小样本训练数据集上进行训练,得到嫌疑支持向量,将这些支持向量加到下一组进行训练,以此类推,最后一组训练得到的支持向量为大样本数据集的支持向量。其次提出了错分样本预选算法,该算法根据支持向量对分离超平面的决定性作用,在大量的训练样本数据集中去除远离分离超平面的样本点,提取支持向量的嫌疑样本,用这些嫌疑样本训练支持向量机,既使用了所有样本的有用信息,又提高了学习效率并节约了时间。实验结果表明:本文提出的两个算法与解凸二次规划所得到的支持向量完全一致,降低了支持向量机的学习难度和运行时间,具有实时性和高效性。
【图文】:

分类问题,分类器,监督学习,分程


庆大学硕士学位论文 2 分类2 分类学习.1 分类的理论基础分类(classification)是把数据按照一定的要求或者规则进行整理和归纳,进行辨别和预测[15]。分类问题的实质是利用对已知数据进行分析得到的模型新采集的未知数据进行预测的过程。分类问题包括学习和分类两个过程。在过程中,根据已知的训练数据集利用有效的学习方法学习一个分类器;在分程中,利用学习的分类器对新的输入实例进行分类,它的核心问题是监督学习类步骤如图 2.1 所示:

模型图,决策树,模型,分类决策树


的问题的基础。为了对训练数据进行正确分类,统计学方面的法,,神经网络和机器学习下的决策树、感知机、SVM 算法等。针对上述的各个方面的算法,本文主要讲述运用相对比较广和支持向量机。首先介绍这些算法的基本概念以及相应的模每个算法的优劣之处。分类算法策树树(decision tree)分为两种:分类决策树和回归决策树,其中树。因为分类问题的实质是利用对已知数据进行分析得到的模知数据进行预测的过程。决策树由结点(node)和有向边(dire中结点分为内部结点(Internal node)和叶结点(leaf node)特征或属性,叶结点表示一个类。因此,分类决策树先对已知型,再利用该模型对未知数据进行正确的预测[3]。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:C81

【参考文献】

相关期刊论文 前10条

1 赵丹;;SVM核函数与选择算法[J];数字技术与应用;2014年09期

2 苗苗;姜建国;;一种采用类电磁机制算法的线性分类方法[J];西安电子科技大学学报;2015年02期

3 何清;李宁;罗文娟;史忠植;;大数据下的机器学习算法综述[J];模式识别与人工智能;2014年04期

4 陈雪芳;杨继臣;;交叉验证KNN支持向量预选取算法在说话人识别上的应用[J];科学技术与工程;2013年20期

5 叶菲;罗军;;基于错分样本的AdaBoost支持向量预选取算法[J];微电子学与计算机;2013年04期

6 王冉;杨道军;;基于支持向量机的巢湖富营养化程度评价研究[J];环境科学与管理;2011年05期

7 白凤凤;;基于不平衡数据集的文本分类技术研究[J];电脑编程技巧与维护;2010年06期

8 朱方;顾军华;杨欣伟;杨瑞霞;;一种新的支持向量机大规模训练样本集缩减策略[J];计算机应用;2009年10期

9 邹元君;王玮;吴运明;;随机分组算法的研究与实现[J];长春理工大学学报(高教版);2007年04期

10 周建钦,赵志远;随机分组查找算法[J];科学通报;1990年24期

相关会议论文 前2条

1 林关成;李亚安;;一种支持向量机训练集选取算法改进[A];2009’中国西部地区声学学术交流会论文集[C];2009年

2 晏庆华;;支持向量机算法综述[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

相关博士学位论文 前1条

1 田亚男;视频输入听觉显示的导盲系统关键技术研究[D];东北大学;2013年

相关硕士学位论文 前5条

1 王春雷;光伏出力短期预测技术研究[D];南昌大学;2015年

2 罗伟;前视车辆检测及定位算法研究与实现[D];电子科技大学;2015年

3 宋丽;基于决策树的组合分类器的研究[D];西安电子科技大学;2012年

4 孟庆武;基于分类不可指定性的清晰决策树归纳算法研究[D];河北大学;2010年

5 杨显飞;基于边界向量预选的支持向量机算法研究[D];哈尔滨工程大学;2008年



本文编号:2676208

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2676208.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b4900***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com