当前位置:主页 > 社科论文 > 生态环境论文 >

基于GPU的支持向量机文本挖掘算法的研究

发布时间:2016-12-29 17:36

  本文关键词:基于格网单元的县级土地利用总体规划生态环境影响评价方法与应用,由笔耕文化传播整理发布。


《北京邮电大学》 2014年

基于GPU的支持向量机文本挖掘算法的研究

王亮  

【摘要】:在21世纪,随着互联网信息的大规模累积,在互联网中充斥大量的文本数据。对网络中的文本数据进行收集,再通过数据文本挖据的方法进行整合、预处理、建模训练和最终的预测,可以完成聚类、分类和推荐等重要的决策。这一类的技术是目前计算机科学与技术领域研究的热点和焦点,也是在大数据时代解决问题的关键途径。 支持向量机算法是一个经典的分类算法,它适合解决小数据集的分类问题。当数据集的规模比较大时,支持向量机的算法的效果不是很好,它需要付出较大的内存空间的代价而且需要更多的训练时间去建模。如何高速的训练大规模的数据集,是支持向量机领域研究的热点。目前存在很多高性能的并行化计算模型,基于GPU的CUDA编程就是其中的一种,它跟其他的计算方式相比,有着个人计算机先天优势,仅仅依靠自己的力量就可以进行高速的计算。 本文将支持向量机和GPU编程相结合,完成了LIBSVM算法的并行化改进,保证预测精确度基本不下降的前提下,训练和预测阶段的计算效率得到了一定提升。本文完成的主要工作如下:针对高性能计算的起源和发展做了简单的回顾与陈述,重点研究了基于GPU的CUDA的体系结构和它所带来的在GPU上编程的革新。针对基于GPU的CUDA编程体系做了深入和全面地研究,对SVM算法的原理做了完整和详细的研究与分析。进行了基于LIBSVM的若干经典数据集的仿真测试,完成了LIBSVM算法的训练和预测流程的分解,对基于LIBSVM算法的CUDA框架进行了搭建,对算法的特点进行了分析,完成了CPU和GPU计算任务的划分,重点研究并完成了核函数矩阵形成的CUDA实现,用于加速LIBSVM算法的训练建模和预测建模两个过程。在不同的测试平台上使用七组经典的数据集进行比对测试,从数据集本身、特征值、训练样本和分类个数等多个角度对测试结果进行了分析。 经过改造可以有效地提升训练建模和预测建模的运行效率,减少它们的运行时间,针对特征值和样本数很大的数据集的效果更明显。

【关键词】:
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1;TP181
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【参考文献】

中国期刊全文数据库 前9条

1 陈述彭,陈秋晓,周成虎;网格地图与网格计算[J];测绘科学;2002年04期

2 程鹏飞,蔡艳辉,王华;GridGNSS——网格化全球卫星导航系统[J];测绘科学;2005年04期

3 韩冀中,韩承德;高性能计算技术的发展现状及趋势[J];中国工程科学;2000年01期

4 夏永祥;史志才;;基于GPU和特征选择的SVM入侵检测模型[J];计算机工程;2012年08期

5 王慧勤;雷刚;;基于LIBSVM的风速预测方法研究[J];科学技术与工程;2011年22期

6 罗成石;;基于LIBSVM的粮食水分数据融合研究[J];科学技术与工程;2012年02期

7 王世春;王平根;;基于CUDA的快速车牌字符识别[J];计算机应用与软件;2012年10期

8 任立辉;李文东;慈兴华;史晓凤;孙政;郑荣儿;;基于LIBSVM的石油录井中岩屑岩性识别方法研究[J];中国海洋大学学报(自然科学版);2010年09期

9 魏洪涛,石峰,李群,王维平;网格计算在军事仿真中的应用[J];系统仿真学报;2005年03期

【共引文献】

中国期刊全文数据库 前10条

1 阳安国;熊助国;刘向铜;;基于AutoCAD的网格化调查数据文件生成综合方法[J];北京测绘;2007年03期

2 王华;程鹏飞;蔡艳辉;;单基站GPS差分系统设计与实现方法[J];测绘工程;2006年01期

3 王喜;杨华;范况生;;城市网格化管理系统的关键技术及示范应用研究[J];测绘科学;2006年04期

4 刘宇;李成名;刘德钦;马维军;;空间信息格网研究进展[J];测绘科学;2007年04期

5 杨帆;米红;;一种基于网格的空间聚类方法在区域划分中的应用[J];测绘科学;2007年S1期

6 阳安国;熊助国;刘向铜;;基于AutoCAD的城市市政信息网格化调查与数据集成方法[J];测绘科学;2008年05期

7 祝会忠;高星伟;李明;;Winsock在网络RTK数据传输中的应用[J];测绘科学;2009年05期

8 胡引翠;网格计算技术的应用及其发展趋势[J];测绘通报;2005年03期

9 李健;吕志平;乔书波;李昌贵;;大规模连续运行基准站网的技术体系[J];测绘通报;2009年01期

10 马昕炜;曾永年;;基于格网单元的县级土地利用总体规划生态环境影响评价方法与应用[J];长江流域资源与环境;2011年10期

中国重要会议论文全文数据库 前5条

1 李雄;党生;;基于网格的复杂战争系统仿真研究[A];第二十六届中国控制会议论文集[C];2007年

2 吕蓬;梁晓燕;李磊;李强;;网格GIS在数字城市中的研究和应用[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年

3 王喜珍;滕云田;胡星星;张旸;吴琼;周鹤鸣;;中国月震探测系统研制[A];中国地球物理·2009[C];2009年

4 郭达志;;天地一体化数字影像地理空间信息的获取与更新[A];煤炭资源高效绿色开采与数字矿山学术讨论会论文集[C];2005年

5 Xiyun Yang;Feifei Jiang;Xiaoning Wu;;Prediction of Lead-acid Storage Battery's Remaining Capacity Based on LM-BP Neural Network[A];第25届中国控制与决策会议论文集[C];2013年

中国博士学位论文全文数据库 前10条

1 冯麟涵;舰船系统抗冲击性能全局优化方法研究[D];哈尔滨工程大学;2009年

2 郑伟;联邦式图书馆资源管理模型研究[D];吉林大学;2011年

3 刘民岷;基于网格计算的分布式仿真关键问题研究[D];电子科技大学;2011年

4 刘嵘;集群式网格地理信息服务注册中心的构建研究[D];解放军信息工程大学;2011年

5 李健;联合型连续运行基准站网的动态定位服务机制[D];解放军信息工程大学;2011年

6 傅明;基于Web的空间数据挖掘研究[D];中南大学;2004年

7 魏洪涛;基于网格计算的仿真任务管理与调度方法研究[D];国防科学技术大学;2005年

8 张建兵;基于网格的空间信息服务关键技术研究[D];中国科学院研究生院(遥感应用研究所);2006年

9 危拥军;三维GIS数据组织管理及符号化表示研究[D];解放军信息工程大学;2006年

10 阮启明;面向区域目标的成像侦察卫星调度问题研究[D];国防科学技术大学;2006年

中国硕士学位论文全文数据库 前10条

1 崔俊芳;邯郸市网格化管理信息系统的研究与开发[D];河北工程大学;2010年

2 张展华;网格计算中容错策略的研究[D];哈尔滨理工大学;2010年

3 曹份槟;基于PCA和SVM的货车故障检测[D];北京交通大学;2011年

4 杨丽婷;基于云计算数据存储技术的研究[D];中北大学;2011年

5 郑伟伟;基于UI调用的地理信息平台[D];太原科技大学;2011年

6 马昕炜;基于格网单元的县级土地利用总体规划生态环境影响评价方法与应用[D];中南大学;2011年

7 秦氏雪;城市网格化管理工作流引擎建模与实现[D];电子科技大学;2011年

8 贺雅璇;教育社交网络平台的设计与实现[D];北京邮电大学;2012年

9 刘勇燕;基于网格的矿井通风计算并行处理模式研究[D];西安科技大学;2003年

10 于雷易;基于空间数据网格的空间数据共享技术研究[D];武汉大学;2004年

【二级参考文献】

中国期刊全文数据库 前10条

1 蔡艳辉,程鹏飞,李夕银;用递归算法实现整周模糊度矢量空间的遍历[J];测绘科学;2002年04期

2 许妙忠;4D产品的生产和应用系列讲座 第三讲 数字栅格地图的生产和应用[J];测绘信息与工程;2002年01期

3 赵振斌,包浩生,马荣华;城市格网化及其景观生态效应研究——以西安市为例[J];地理科学;2001年05期

4 秦昆,关泽群,李德仁,周军其;基于栅格数据的最佳路径分析方法研究[J];国土资源遥感;2002年02期

5 陈丽;陈静;高新涛;王来生;;基于支持向量机与反K近邻的分类算法研究[J];计算机工程与应用;2010年24期

6 张小云,刘允才;高斯核支撑向量机的性能分析[J];计算机工程;2003年08期

7 史志才;夏永祥;;基于知识约简的网络入侵特征提取[J];计算机工程;2011年05期

8 于海鹏;刘一星;刘镇波;;基于图像纹理特征的木材树种识别[J];林业科学;2007年04期

9 李小昱,王为,雷廷武,沈逸;多传感器信息融合技术及在农业工程中的应用前景[J];农业工程学报;2003年03期

10 蒋平;朱传祥;吕德志;高成冲;;循环式粮食干燥机的智能控制系统[J];农业工程学报;2006年11期

中国重要会议论文全文数据库 前1条

1 程鹏飞;;伽利略卫星导航定位系统最新进展[A];地理空间信息技术与应用——中国科协2002年学术年会测绘论文集[C];2002年

中国硕士学位论文全文数据库 前1条

1 肖洋;风电场风速和发电功率预测研究[D];东北电力大学;2005年

【相似文献】

中国期刊全文数据库 前10条

1 杨强,吴中福,余平,钟将;基于正反馈的支持向量机[J];重庆大学学报(自然科学版);2004年05期

2 孙蕾,周明全,李丙春;一种非平衡分布数据的支持向量机新算法[J];计算机应用;2004年12期

3 黄勇;郑春颖;宋忠虎;;多类支持向量机算法综述[J];计算技术与自动化;2005年04期

4 杨强,吴中福,余萍,钟将;一种新型支持向量机[J];重庆大学学报(自然科学版);2005年02期

5 张猛,付丽华,王高峰;模糊临近支持向量机[J];计算机工程与应用;2005年05期

6 张浩然;汪晓东;张长江;徐秀玲;;一种新型回归支持向量机的学习算法[J];测试技术学报;2006年02期

7 王晔;黄上腾;;基于间隔区域样本数量的加权支持向量机[J];计算机工程;2006年06期

8 梁新荣;刘智勇;孙德山;毛宗源;;支持向量机在混沌系统预测中的应用[J];计算机应用研究;2006年05期

9 卢敏;张展羽;冯宝平;贾仁辅;;基于支持向量机的区域水安全预警模型及应用[J];计算机工程;2006年15期

10 张阳;刘永革;景旭;;一种改进的线性支持向量机的特征筛选算法[J];西北农林科技大学学报(自然科学版);2006年10期

中国重要会议论文全文数据库 前10条

1 侯澍旻;李友荣;刘光临;;基于支持向量机的设备振动信号趋势预测[A];12省区市机械工程学会2006年学术年会湖北省论文集[C];2006年

2 张晓滨;尹英顺;赵培坤;马秀兰;;基于渐进直推支持向量机的半对半多类文本分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

3 徐会敏;王玉兰;;线性规划支持向量机模型的研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

4 晏庆华;;支持向量机算法综述[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

5 郭一楠;程健;肖大伟;杨梅;;分布式多分类支持向量机[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年

6 林关成;李亚安;;一种支持向量机训练集选取算法改进[A];2009’中国西部地区声学学术交流会论文集[C];2009年

7 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年

8 李方方;赵英凯;贾玉莹;杜杰;;基于最小二乘支持向量机的油品质量预测[A];第25届中国控制会议论文集(上册)[C];2006年

9 曾江辉;耿金凤;汪邦军;郝建春;;面向时间序列质量波动预测的支持向量机回归模型研究[A];使命与责任—以质量方法促转型升级——第五届中国质量学术与创新论坛论文集(上)[C];2012年

10 戴林超;吴琳丽;赵海娜;李训铭;;基于最小二乘支持向量机的故障预测法[A];2009年中国智能自动化会议论文集(第六分册)[中南大学学报(增刊)][C];2009年

中国博士学位论文全文数据库 前10条

1 周喜川;非可信环境下的支持向量机研究[D];浙江大学;2010年

2 常甜甜;支持向量机学习算法若干问题的研究[D];西安电子科技大学;2010年

3 王超;三类不确定支持向量机及其应用[D];河北大学;2013年

4 杜喆;几类支持向量机变型算法的研究[D];西安电子科技大学;2009年

5 张国云;支持向量机算法及其应用研究[D];湖南大学;2006年

6 李海生;支持向量机回归算法与应用研究[D];华南理工大学;2005年

7 李华庆;支持向量机及其在人脸识别中的应用研究[D];上海交通大学;2006年

8 刘京礼;鲁棒最小二乘支持向量机研究与应用[D];中国科学技术大学;2010年

9 董春曦;支持向量机及其在入侵检测中的应用研究[D];西安电子科技大学;2004年

10 唐发明;基于统计学习理论的支持向量机算法研究[D];华中科技大学;2005年

中国硕士学位论文全文数据库 前10条

1 周林成;小波支持向量机在数据建模中的研究及应用[D];江南大学;2008年

2 王芳;支持向量机算法的研究及应用[D];江南大学;2008年

3 高泓;基于支持向量机的动态预测方法与实现技术研究[D];大庆石油学院;2009年

4 王永吉;支持向量机泛化性能的研究及其应用[D];江南大学;2009年

5 梁宏霞;支持向量机模型研究及应用[D];辽宁师范大学;2009年

6 孙庆嘉;多类支持向量机的研究与分析[D];北京交通大学;2010年

7 朱杰;基于最小二乘支持向量机的传染病预测与研究[D];苏州大学;2009年

8 王琳;支持向量机及相关理论研究[D];辽宁师范大学;2010年

9 万家强;支持向量机在质量管理中的应用研究[D];重庆理工大学;2010年

10 李响;基于半监督支持向量机的网络流量分类机制的研究与实现[D];北京邮电大学;2011年


  本文关键词:基于格网单元的县级土地利用总体规划生态环境影响评价方法与应用,,由笔耕文化传播整理发布。



本文编号:228782

资料下载
论文发表

本文链接:https://www.wllwen.com/shengtaihuanjingbaohulunwen/228782.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户58721***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com