基于Spark的情报大数据可视化分析

发布时间:2018-01-01 17:15

  本文关键词:基于Spark的情报大数据可视化分析 出处:《山东大学》2017年硕士论文 论文类型:学位论文


  更多相关文章: Spark 大数据可视化 社区分析 情报分析 图计算


【摘要】:信息化时代数据量激增,同时由于情报部门等特殊需求部门多年来对信息的积累,存储了大量结构化、半结构化数据,由于受技术水平、创新意识、支撑保障等诸多因素影响,出现不同程度的信息壁垒,信息共享度、利用率不高,如何利用这些情报数据掌握社会动向、分析事态的演化趋势,进而提前预警预测,并为决策者提出决策性的建议,尚有大量知识需要研究。大数据技术经过多年的发展和完善已经趋于成熟,使用大数据技术进行情报分析,可有效的利用数据,为决策者提供可靠的指引。通过对信息的采集、整合并辅以大数据技术,大力推进相关部门的信息化建设。利用Spark运行在内存中的特点,为使用者提供高效的、交互式的查询和计算,快速展现数据内在信息,提高情报机关工作效率。本系统以Spark、Hadoop大数据技术为基础,面向特殊应用信息库、各情报资源信息库等已有数据库或其他多种类型数据文件,辅以GraphX图计算框架、SparkRDD、SparkSQL等工具,进行快速、高效的信息查询和多种图形化展示,并为使用者提供对社区人群的分析、通话分析、人员关联查询等多种功能。本文主要工作内容如下:1、研究情报系统业务模型,以及情报、特殊部门的具体需求分析,研究Spark、Hadoop大数据分析与存储技术、基于J2EE的前端系统、分布式消息系统以及数据清洗和数据库使用等,并设计了情报大数据分析系统的一种实现方法。2、开发前端系统使用J2EE技术架构,搭载Spring、SpringMVC、Mybatis三大框架作为前端展示系统。其中视图层采用FreeMarker、JQuery EasyUI、ECharts等组件提供多种形式、直观的数据展示。使用Oracle数据库,为面端组件、用户名、密码等信息提供持久化服务。3、分布式计算和传输系统开发。前端展示系统通过Apache Kafka集群与Spark集群进行实时交互。Spark集群主要负责对数据进行计算、分析。通过使用Spark RDD、SparkSQL、GrpahX、GraphFrame等工具进行社区发现、重点人员查找、话单分析、人群分析等功能,并将结果通过Kafka集群实时的反馈给前端展示系统。4、数据清洗和导入工作。数据存储采用分布式系统存储,并支持多种数据来源的导入,如关系型数据库、文本文档、CSV文件等。经过数据清洗后统一存放在HDFS系统中。通过Sqoop实现对存储系统定时更新的功能,在固定时间间隔将外部数据导入到存储系统中,保证数据的实时有效性。大数据分析系统通过将分散在不同业务部门的信息通过汇总、提取、计算实现了部门之间的信息交换,打破信息壁垒,并提供高效、直观、多样的数据可视化处理,为情报机关工作效率和能力的提高发挥积极作用。
[Abstract]:At the same time, due to the accumulation of information by intelligence departments and other special needs departments over the years, a large number of structured, semi-structured data are stored, due to the level of technology, innovation awareness. Many factors, such as support and security, appear different degree of information barriers, information sharing degree, low utilization rate, how to use these information data to grasp the social trends and analyze the evolving trend of the situation. There is still a lot of knowledge to study. Big data technology has matured after many years of development and improvement. Big data technology is used to carry out information analysis. Data can be used effectively to provide reliable guidance for decision makers. Through the collection of information, integration and supplemented by big data technology. Vigorously promote the information construction of relevant departments, make use of the characteristics of Spark running in memory, provide users with efficient, interactive query and calculation, and quickly display the internal information of the data. This system is based on the technology of Sparku Hadoop big data and faces the special application information database. The existing databases or other kinds of data files, such as information base of intelligence resources, are carried out quickly with tools such as SparkRDDD Spark SQL, a framework for calculating GraphX diagrams. Efficient information query and a variety of graphical display, and provide users with community crowd analysis, call analysis, personnel association query and other functions. The main work of this paper is as follows: 1. This paper studies the business model of information system, as well as the analysis of the specific requirements of intelligence and special departments, and studies the analysis and storage technology of Spark Hadoop big data, the front-end system based on J2EE. Distributed message system, data cleaning and database usage, etc., and designed an implementation method of intelligence big data analysis system. The front-end system uses J2EE technology architecture and carries Spring. Spring MVC / Mybatis is used as the front end display system, in which the view layer adopts FreeMarker JQuery EasyUI. ECharts and other components provide a variety of forms of visual data display. Use Oracle database to provide persistence services for facet components, user names, passwords and other information. Distributed computing and transmission system development. The front-end display system through Apache Kafka cluster and Spark cluster real-time interaction. Spark cluster is mainly responsible for data calculation. Analysis. Through the use of Spark RDDN Spark SQL Grpah XN GraphFrame and other tools for community discovery, key people to find, voice analysis. Crowd analysis and other functions, and the results through the Kafka cluster real-time feedback to the front-end display system. 4, data cleaning and import work. Data storage using distributed system storage. And supports the import of various data sources, such as relational databases, text documents. After data cleaning, the CSV file is stored in the HDFS system. Through Sqoop, the storage system is updated periodically, and the external data is imported into the storage system at fixed time intervals. To ensure the real-time validity of the data. Big data analysis system through the aggregation of information scattered in different business departments through extraction, computing to achieve information exchange between departments, break down information barriers, and provide efficiency. Visual and diversified data visualization plays an active role in improving the efficiency and ability of intelligence agencies.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 董庆华;;数据可视化技术在农业领域的应用探讨[J];山西农业大学学报(自然科学版);2007年S1期

2 姚远;;数据可视化技术实现流程探讨[J];软件导刊;2010年05期

3 赵巾帼;罗庆云;;基于网络的数据可视化研究与实现[J];大庆师范学院学报;2010年06期

4 任思雨;;数字时代数据可视化的类型及其特征[J];传播与版权;2014年03期

5 陈建军,于志强,朱昀;数据可视化技术及其应用[J];红外与激光工程;2001年05期

6 刘勘,周晓峥,周洞汝;数据可视化的研究与发展[J];计算机工程;2002年08期

7 刘绪崇,邓苏,杨强,陈卫东;基于数据管技术的证券数据可视化[J];计算机工程与设计;2003年06期

8 肖湘萍,尹志喜;数据可视化在流场数值模拟中的应用研究[J];华北工学院学报;2004年02期

9 任永功;于戈;;数据可视化技术的研究与进展[J];计算机科学;2004年12期

10 韩丽娜;;数据可视化技术及其应用展望[J];煤矿现代化;2005年06期

相关会议论文 前10条

1 刘勘;周洞汝;;大型数据库中的数据可视化技术[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

2 袁永菊;;数据可视化技术在飞机改装中的应用研究[A];探索 创新 交流(第4集)——第四届中国航空学会青年科技论坛文集[C];2010年

3 石昊苏;韩丽娜;;数据可视化技术及其应用展望[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年

4 夏菁;刘真;胡越琦;陈为;彭帝超;;基于超图的骨生物数据可视化研究[A];第五届全国几何设计与计算学术会议论文集[C];2011年

5 陈进生;罗月童;;轮廓树及其在体数据可视化中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

6 罗雄飞;廖再飞;刘伟;;流程工业多尺度数据可视化系统的设计与应用[A];2009中国过程系统工程年会暨中国mes年会论文集[C];2009年

7 谢跟踪;陈文惠;郑达贤;;基于Map Info的福建省经济数据可视化研究[A];地图学与GIS学术讨论会论文集[C];2002年

8 王延红;王宏亮;林成地;高菲;;基于VisIt的Fluent程序结果数据可视化[A];第十六届全国流体力学数值方法研讨会2013论文集[C];2013年

9 宋秀红;张维石;;基于RAD的网站用户浏览数据可视化工具研究[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年

10 周杨;徐青;蓝朝桢;李建胜;;深空探测地理数据可视化[A];第十四届全国图象图形学学术会议论文集[C];2008年

相关重要报纸文章 前4条

1 国家统计局教育中心 宁红;数据可视化对服务型统计建设的启示[N];中国信息报;2013年

2 北京永洪商智科技有限公司 何春涛;一周实现大数据可视化分析[N];中国计算机报;2014年

3 本报记者 于杰;让POI数据可视化[N];中国计算机报;2014年

4 邱燕娜;从汶川地震话位置智能[N];中国计算机报;2008年

相关博士学位论文 前7条

1 任永功;面向聚类的数据可视化方法及相关技术研究[D];东北大学;2006年

2 马仁安;基于微机的三维地震数据可视化技术研究[D];南京理工大学;2004年

3 华岗;地震体数据可视化与分析研究[D];浙江大学;2011年

4 周璐;复杂向量场数据可视化技术研究与实现[D];中国人民解放军国防科学技术大学;2000年

5 梁秀霞;医学影像数据可视化中若干问题研究[D];山东大学;2006年

6 常凤香;基于生物电阻抗测量原理的经络诊断数据可视化方法研究[D];燕山大学;2012年

7 蒋志方;城市空气质量预测模型与数据可视化方法研究[D];山东大学;2011年

相关硕士学位论文 前10条

1 曾悠;大数据时代背景下的数据可视化概念研究[D];浙江大学;2014年

2 石雪萍;网易“数读”专栏报道特色研究[D];河北大学;2015年

3 陈欣;《21世纪经济报道—飞笛金融圈》金融新闻的数据可视化研究[D];河北大学;2015年

4 张健;基于WebGIS的农业地理数据可视化技术研究及应用[D];浙江大学;2015年

5 龚旭超;基于webGL的交互绘制应用研究[D];浙江大学;2015年

6 臧若蒙;面向车辆监控系统的海量数据可视化研究[D];大连海事大学;2015年

7 刘迪珊;试验数据云平台中数据可视化的设计与实现[D];西安电子科技大学;2014年

8 朱会国;直观高效的体数据可视化方法的设计与研究[D];合肥工业大学;2014年

9 吕佩吾;火电厂生产运行数据可视化平台的研究与实现[D];华北电力大学;2015年

10 陈丁;海洋水文数据可视化关键技术研究[D];解放军信息工程大学;2015年



本文编号:1365448

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1365448.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户43b4c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com