基于Hadoop平台的SPRINT算法的分析与研究
本文选题:Hadoop + MapReduce ; 参考:《南京师大学报(自然科学版)》2016年04期
【摘要】:传统的决策树算法在单机平台上处理海量数据挖掘时,容易受到计算能力和存储能力的限制,所以存在耗时过长、容错性差、存储量小的缺点.而拥有高可靠性和高容错性的Hadoop平台的出现为决策树算法的并行化提供了新的思路.本文设计和实现了一种基于Hadoop平台的并行SPRINT分类算法.实验结果表明:基于Hadoop平台的SPRINT分类算法比没有进行并行化的SPRINT算法具有较好的分类正确率、较低的时间复杂度和较好的并行性能,并且能明显提高算法求最佳分裂点时的执行速度.
[Abstract]:The traditional decision tree algorithm is easy to be limited by computing power and storage ability when processing massive data mining on a single computer platform, so it has the disadvantages of long time consuming, poor fault tolerance and small storage capacity. The emergence of Hadoop platform with high reliability and fault tolerance provides a new idea for parallelization of decision tree algorithm. This paper designs and implements a parallel SPRINT classification algorithm based on Hadoop platform. Experimental results show that the SPRINT classification algorithm based on Hadoop platform has better classification accuracy, lower time complexity and better parallel performance than the SPRINT algorithm without parallelization. And it can obviously improve the execution speed of the algorithm to find the best split point.
【作者单位】: 南京邮电大学计算机学院软件学院;
【基金】:国家自然科学基金(61171053)
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 ;Sprint在旧金山启动4G网络[J];移动通信;2010年24期
2 ;ZTE Brings International Mobile Hotspotto Sprint Customers[J];ZTE Communications;2011年03期
3 张荣;江苏省邮电管理局再度与Sprint公司签约[J];现代电信科技;1994年07期
4 谭勇;一个基于SPRINT的分类算法的实现[J];湖北民族学院学报(自然科学版);2004年02期
5 刘n\;Sprint转型的实践及经验[J];当代通信;2005年16期
6 罗可,张学茂;SPRINT算法及其改进方法[J];计算机工程与应用;2005年32期
7 ;Sprint/Nextel:运营商如何迎接多媒体业务?[J];通讯世界;2005年11期
8 刘友军;汪林林;;SPRINT算法的改进[J];计算机工程;2006年16期
9 宾宁;;基于SPRINT分类算法挖掘保险业务数据中的风险规则[J];广东工业大学学报;2007年02期
10 雷炜;;基于SPRINT分类算法进行医学预后分析的研究与应用[J];现代计算机(专业版);2008年10期
相关重要报纸文章 前10条
1 ;Sprint推出按次计费手机电影服务[N];人民邮电;2006年
2 ;美国Sprint公司终止用户服务合同[N];人民邮电;2007年
3 ;Sprint推出手机购物门户[N];人民邮电;2007年
4 孟帆;Sprint拒绝50亿美元投资要约[N];人民邮电;2007年
5 证券时报记者 彭妮;美通讯巨头Sprint单季巨亏295亿美元[N];证券时报;2008年
6 ;Sprint裁员应对业绩下滑[N];人民邮电;2008年
7 ;Sprint移动互联用户达到100万[N];人民邮电;2001年
8 记者 郭庆婧;Sprint可能陷入领导危机[N];人民邮电;2003年
9 晓雅;Sprint进军无线咨询业务[N];人民邮电;2005年
10 郭庆婧;Sprint:陷入亏损困境[N];人民邮电;2008年
,本文编号:1942385
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1942385.html