基于Spark并行SVM参数寻优算法的研究

发布时间：2021-09-29 07:56

　　针对传统支持向量机（SVM）参数寻优算法在处理大样本数据集时存在的寻优时间过长,内存消耗过大等问题,提出了一种基于Spark通用计算引擎的并行可调SVM参数寻优算法。该算法首先使用Spark集群将训练集以广播变量的形式广播给各个Executor,然后并行化SVM的参数寻优过程,并在在寻优过程中控制Task并行度,使各个Executor负载均衡,从而加快寻优速度。实验结果表明,本文提出的参数寻优算法,通过设置合理的Task并行度,可以在充分使用集群资源的同时提高最优参数的寻找速度,减少寻优时间。

【文章来源】：武汉工程大学学报. 2019,41(03)

【文章页数】：7 页

【参考文献】：
期刊论文
[1]基于Spark的分布式大数据分析算法研究[J]. 宋泊东,张立臣,江其洲.  计算机应用与软件. 2019(01)
[2]基于Hadoop平台的分布式SVM参数寻优[J]. 吴云蔚,宁芊.  计算机工程与科学. 2017(06)
[3]Hadoop云平台MapReduce模型优化研究[J]. 张红,王晓明,曹洁,马彦宏,郭义戎,王慜.  计算机工程与应用. 2016(22)
[4]基于Spark的并行SVM算法研究[J]. 刘泽燊,潘志松.  计算机科学. 2016(05)
[5]基于Spark的LIBSVM参数优选并行化算法[J]. 李坤,刘鹏,吕雅洁,张国鹏,黄宜华.  南京大学学报(自然科学). 2016(02)
[6]基于Hadoop云平台的分布式支持向量机[J]. 张小琴,胡景,肖炜.  山西师范大学学报(自然科学版). 2015(04)
[7]基于MapReduce的SVM分类算法研究[J]. 秦军,戴新华,童毅,林巧民.  计算机技术与发展. 2015(06)
[8]海量数据挖掘过程相关技术研究进展[J]. 米允龙,米春桥,刘文奇.  计算机科学与探索. 2015(06)
[9]基于MapReduce的层叠分组并行SVM算法研究[J]. 张鹏翔,刘利民,马志强.  计算机应用与软件. 2015(03)

硕士论文
[1]Hadoop平台参数寻优的分布式SVM算法研究[D]. 王越.西安理工大学 2016

本文编号：3413349

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3413349.html

上一篇：基于遗传算法的园艺植物病虫害识别方法研究
下一篇：基于弹性理论和复杂网络理论的电网关键环节辨识方法

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|