基于大数据的辅助专家分析系统的设计与实现
本文选题:大数据分析 + MapReduce ; 参考:《浙江大学》2017年硕士论文
【摘要】:大数据时代,各行各业越来越多的企业或组织将受益于大数据这个发展机遇,大数据分析能够实现大数据规模效应下的数据计算和全面的数据洞察,帮助企业提高生产力、提升竞争力、促进企业革新。然而大数据分析对于许多企业或组织来说存在着许多难题,在数据库软件、大数据采集和规约、发展企业专业分析人员等方面仍存在着一些瓶颈。为适应企业的大数据分析需求,本文设计了基于大数据分析的辅助专家分析系统,集成了数据采集、数据存储、数据分析、数据可视化等功能,并提供了友好的人机交互界面,屏蔽大数据分析算法细节,以帮助企业人员简单高效地使用大数据分析技术进行高并发快速查询,建立复杂数据处理模型,自定义可视化模块来展现大数据的价值,促进企业的业务提升、支持企业决策。本文的辅助专家分析系统综合利用了阿里云的ADS和MaxCompute两个PaaS服务,后者是基于MapReduce框架的。MapReduce是在多节点上并行处理大数据的高可扩展的、具有容错能力的编程框架,本文分类设计了基于MapReduce的基本操作模型,以供用户自由自合配置复杂的数据处理逻辑。专家还可以根据领域经验向平台加入可重用可扩展计算分析模块以扩充系统的数据分析处理能力,方便用户进行迭代增量式数据探索。
[Abstract]:In the era of big data, more and more enterprises or organizations from all walks of life will benefit from the development opportunity of big data. Big data analysis can realize the data calculation and comprehensive data insight under the big data scale effect, and help enterprises improve their productivity. Enhance competitiveness and promote enterprise innovation. However, there are many difficulties in big data analysis for many enterprises or organizations. There are still some bottlenecks in database software, big data collection and specification, the development of enterprise professional analysts and so on. In order to meet the needs of big data analysis of enterprises, this paper designs an assistant expert analysis system based on big data analysis, which integrates the functions of data acquisition, data storage, data analysis and data visualization, and provides a friendly man-machine interface. Shielding the details of big data analysis algorithm to help enterprise personnel to use big data analysis technology to carry out high concurrency and fast query, set up complex data processing model, and customize the visualization module to show the value of big data. Promote business promotion and support enterprise decision-making. The auxiliary expert analysis system in this paper synthesizes two PaaS services, ads and Max Compute of Ali Cloud. The latter is a highly extensible, fault-tolerant programming framework based on MapReduce framework to process big data in parallel on multiple nodes. In this paper, the basic operation model based on MapReduce is designed and classified to allow users to freely self-configure complex data processing logic. Experts can also add reusable scalable computing and analysis module to the platform according to domain experience to expand the data analysis and processing ability of the system so as to facilitate the user to explore the data iteratively and incrementally.
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 董庆华;;数据可视化技术在农业领域的应用探讨[J];山西农业大学学报(自然科学版);2007年S1期
2 姚远;;数据可视化技术实现流程探讨[J];软件导刊;2010年05期
3 赵巾帼;罗庆云;;基于网络的数据可视化研究与实现[J];大庆师范学院学报;2010年06期
4 任思雨;;数字时代数据可视化的类型及其特征[J];传播与版权;2014年03期
5 陈建军,于志强,朱昀;数据可视化技术及其应用[J];红外与激光工程;2001年05期
6 刘勘,周晓峥,周洞汝;数据可视化的研究与发展[J];计算机工程;2002年08期
7 刘绪崇,邓苏,杨强,陈卫东;基于数据管技术的证券数据可视化[J];计算机工程与设计;2003年06期
8 肖湘萍,尹志喜;数据可视化在流场数值模拟中的应用研究[J];华北工学院学报;2004年02期
9 任永功;于戈;;数据可视化技术的研究与进展[J];计算机科学;2004年12期
10 韩丽娜;;数据可视化技术及其应用展望[J];煤矿现代化;2005年06期
相关会议论文 前10条
1 刘勘;周洞汝;;大型数据库中的数据可视化技术[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 袁永菊;;数据可视化技术在飞机改装中的应用研究[A];探索 创新 交流(第4集)——第四届中国航空学会青年科技论坛文集[C];2010年
3 石昊苏;韩丽娜;;数据可视化技术及其应用展望[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
4 夏菁;刘真;胡越琦;陈为;彭帝超;;基于超图的骨生物数据可视化研究[A];第五届全国几何设计与计算学术会议论文集[C];2011年
5 陈进生;罗月童;;轮廓树及其在体数据可视化中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
6 罗雄飞;廖再飞;刘伟;;流程工业多尺度数据可视化系统的设计与应用[A];2009中国过程系统工程年会暨中国mes年会论文集[C];2009年
7 谢跟踪;陈文惠;郑达贤;;基于Map Info的福建省经济数据可视化研究[A];地图学与GIS学术讨论会论文集[C];2002年
8 王延红;王宏亮;林成地;高菲;;基于VisIt的Fluent程序结果数据可视化[A];第十六届全国流体力学数值方法研讨会2013论文集[C];2013年
9 宋秀红;张维石;;基于RAD的网站用户浏览数据可视化工具研究[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
10 方泳;刘杰;;街道级社区服务计算机网络系统功能设计及组织运行机制若干问题的研究[A];全国青年管理科学与系统科学论文集第5卷[C];1999年
相关重要报纸文章 前4条
1 国家统计局教育中心 宁红;数据可视化对服务型统计建设的启示[N];中国信息报;2013年
2 北京永洪商智科技有限公司 何春涛;一周实现大数据可视化分析[N];中国计算机报;2014年
3 本报记者 赵姗;大数据时代来临,中国准备好了吗?[N];中国经济时报;2013年
4 本报记者 于杰;让POI数据可视化[N];中国计算机报;2014年
相关博士学位论文 前10条
1 王启超;面向体数据可视化的数据预处理方法研究[D];浙江大学;2017年
2 刘海青;大规模VANET数据传输策略的研究[D];山东大学;2015年
3 郭长友;基于不确定理论的云数据处理关键技术研究[D];北京科技大学;2016年
4 任永功;面向聚类的数据可视化方法及相关技术研究[D];东北大学;2006年
5 马仁安;基于微机的三维地震数据可视化技术研究[D];南京理工大学;2004年
6 华岗;地震体数据可视化与分析研究[D];浙江大学;2011年
7 周璐;复杂向量场数据可视化技术研究与实现[D];中国人民解放军国防科学技术大学;2000年
8 梁秀霞;医学影像数据可视化中若干问题研究[D];山东大学;2006年
9 常凤香;基于生物电阻抗测量原理的经络诊断数据可视化方法研究[D];燕山大学;2012年
10 蒋志方;城市空气质量预测模型与数据可视化方法研究[D];山东大学;2011年
相关硕士学位论文 前10条
1 吴晓晓;基于大数据的辅助专家分析系统的设计与实现[D];浙江大学;2017年
2 曾悠;大数据时代背景下的数据可视化概念研究[D];浙江大学;2014年
3 石雪萍;网易“数读”专栏报道特色研究[D];河北大学;2015年
4 陈欣;《21世纪经济报道—飞笛金融圈》金融新闻的数据可视化研究[D];河北大学;2015年
5 张健;基于WebGIS的农业地理数据可视化技术研究及应用[D];浙江大学;2015年
6 龚旭超;基于webGL的交互绘制应用研究[D];浙江大学;2015年
7 臧若蒙;面向车辆监控系统的海量数据可视化研究[D];大连海事大学;2015年
8 刘迪珊;试验数据云平台中数据可视化的设计与实现[D];西安电子科技大学;2014年
9 朱会国;直观高效的体数据可视化方法的设计与研究[D];合肥工业大学;2014年
10 吕佩吾;火电厂生产运行数据可视化平台的研究与实现[D];华北电力大学;2015年
,本文编号:2041912
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2041912.html