当前位置:主页 > 科技论文 > 软件论文 >

BDAP——一个基于Spark的数据挖掘工具平台

发布时间:2018-08-09 07:56
【摘要】:大数据处理系统是大数据领域的一个热点,为此首先研究大数据分析平台的架构与功能,将大数据分析平台分为数据源、数据吸收层、数据存储层、平台层、安全与监控层、设备层和应用层.平台包含多个数据预处理和算法模块,平台架构为大数据分析了奠定基础.在功能上,该平台功能全面,可以自由组合各种操作,模块之间耦合度低,便于维护和拓展.在用户体验上,调参、建立流程、监控、数据挖掘过程都是可视的,融合工作流和调度流技术.在性能上,该平台相应算法的性能优于Hive和MLlib.最后,举例说明大数据挖掘平台的应用场景.可以对电网线路故障和气象数据进行预处理,从而对故障进行预测和分类,可以通过视频挖掘组件,对数据分类.
[Abstract]:Big data processing system is a hot spot in the field of big data. Firstly, the architecture and function of big data analysis platform are studied. The big data analysis platform is divided into data source, data absorption layer, data storage layer, platform layer, security and monitoring layer. Device layer and application layer. The platform consists of several data preprocessing and algorithm modules. The platform architecture lays the foundation for big data analysis. In terms of function, the platform has comprehensive function, can combine various operations freely, and has low coupling degree between modules, so it is easy to maintain and expand. In the user experience, the processes of adjusting parameters, establishing flow, monitoring and data mining are all visible, and the workflow and scheduling technologies are integrated. The performance of the algorithm is better than that of Hive and MLlib. Finally, an example is given to illustrate the application scenario of big data mining platform. It can preprocess the line fault and meteorological data of power network, so as to predict and classify the fault, and can classify the data by video mining component.
【作者单位】: 北京邮电大学智能通信软件与多媒体北京重点实验室;北京邮电大学计算机学院;国网山东省电力公司电力科学研究院;
【基金】:国家高技术研究发展(863)计划(2015AA050204) 国网科技项目(520626150032) 北京市教育委员会共建项目建设计划资助
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 刘世平 ,姚玉辉;数据挖掘工具的评判[J];数字财富;2003年06期

2 苏卫;数据挖掘工具的应用与标准化[J];计算机工程;2004年S1期

3 周宇葵;刘莉;;数据挖掘工具能力评估研究[J];中国中医药现代远程教育;2005年12期

4 李逸波;于吉红;白晓明;;合理选择数据挖掘工具[J];计算机与信息技术;2005年06期

5 钱峰;;国内数据挖掘工具研究综述[J];情报杂志;2008年10期

6 刘华;王永庆;;数据挖掘工具SAS Enterprise Miner进展研究[J];信息系统工程;2013年08期

7 郝先臣,张德干,高光来,赵海;数据挖掘工具和应用中的问题[J];东北大学学报;2001年02期

8 高英明,刘克勤;基于数据仓库的数据挖掘工具[J];现代电力;2002年02期

9 周健吉;数据挖掘工具的评判[J];电脑知识与技术;2004年23期

10 姚毓才;王本年;;数据挖掘工具的分类与挖掘[J];计算机技术与发展;2006年08期

相关会议论文 前4条

1 李忍;孙晶;刘令君;;一个体育比赛技战术分析数据挖掘工具的设计与实现[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年

2 马杰;胡海峰;马玉书;;基于人工神经网络的数据挖掘工具[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年

3 马杰;刘月田;胡海峰;马玉书;;具有多种神经网络模型的数据挖掘工具[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

4 邵华;万家华;王剑虎;何耀东;张霞;;一个以用户为中心的数据挖掘工具:Open Miner[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

相关重要报纸文章 前2条

1 刘庆;关于数据挖掘工具的讨论[N];网络世界;2006年

2 ;SAS抗经济衰退解决方案受青睐[N];中国保险报;2009年

相关硕士学位论文 前8条

1 江凯;基于Hadoop的并行贝叶斯分类算法及工具研究[D];南京大学;2013年

2 郭峰;达梦数据挖掘工具的设计与实现[D];华中科技大学;2009年

3 徐小蕾;基于组件的数据挖掘工具的研究与实现[D];东华大学;2009年

4 贺伟淞;可视化数据挖掘工具的设计与实现[D];电子科技大学;2005年

5 咸洁敏;高额欠费风险用户预测模型的建立与应用[D];上海交通大学;2010年

6 郭鑫;基于CRISP-DM的流程可视化数据挖掘工具的研究与实现[D];东华大学;2009年

7 李忍;一个体育比赛技战术分析数据挖掘工具的设计与实现[D];北方工业大学;2008年

8 黄晶晶;机会发现的形式描述与形式建模的研究[D];哈尔滨工程大学;2007年



本文编号:2173424

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2173424.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户61b75***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com