寄递大数据分析系统的设计与实现
[Abstract]:With the continuous development of network and information technology, online shopping is favored by more and more users because of its convenience and quickness, which brings about a surge in the amount of data sent and delivered. Massive data delivery brings new challenges to enterprises. The traditional enterprise analysis system stores the data in the relational data. Moreover, as the amount of data grows, the expansion of the system is costly. Therefore, this subject is devoted to the construction of a new data analysis system. The research contents of this paper mainly include the following aspects: (1) study and study the existing big data processing technology. The existing big data processing technology is dominated by two modes: batch computing and flow computing. Through comparison and analysis, this paper selects Hadoop and Storm as the core components of the analysis and calculation of the system. Through the study of open source software such as Hadoop,Hive,Flume,Kafka,Storm, we deeply understand the two modes of big data's processing technology. (2) analyze the bottleneck of the existing "safety supervision" system, and put forward the construction goal of this system. The bottleneck of the existing safety monitoring system is mainly focused on the performance of some complicated statistical functions. When the number of single data reaches 5000, the analysis time of the more complex query statistical functions, such as running query statistics, forecasting the trend of traffic and so on, exceeds 500 seconds, and the system times out. The goal of this system is to overcome the bottleneck of "safety supervision" system analysis by building a new analysis system, and to realize the complex analysis and statistics function mentioned above on the new system. (3) the architecture design of the system is given. The system is implemented according to the architecture design. The system includes four modules: data acquisition module, data preprocessing module, data storage and analysis module and data display module. Data acquisition module is the foundation of system construction. One of the "safety monitoring" system is the use of Log4j logging system. Big data analysis system uses Flume log collection tool to collect log files and write them into HDFS. In view of the structured data in the database of "safety supervision" system (relational database), the system adopts Java program to extract regularly. In view of the real-time data acquisition, the system adopts Flume to push the Log4j log message directly into the Kafka. Data preprocessing module is one of the important parts of the system. The system processes the data into clean and reliable data through the data preprocessing module. Data storage and analysis module is the core module of the system. According to the business requirements, this paper uses three different data analysis and processing techniques, Hive,MapReduce and Storm, to analyze the data. The data display module displays the system results. This module uses the mainstream J2EE architecture and MVC programming mode to design and implement, can provide a friendly display interface to users. (4) build the system environment, and test and verify the system. In this paper, a Hadoop cluster with 20 nodes and a Storm cluster with 5 nodes are built, and the system is tested and verified. The experimental results show that when the scale of single data is 5000, the analysis and processing time of the system is reduced to about 100 seconds, which fully meets the design requirements. In order to overcome the bottleneck problem of traditional relational database analysis system, this paper designs and implements the analysis system of sending big data. Through experiments, it is proved that the system has obvious advantages in analyzing massive data.
【学位授予单位】:中国科学院大学(中国科学院工程管理与信息技术学院)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 代美;陈林;赵惠燕;程登发;;扫描昆虫雷达数据分析系统的设计和研究[J];计算机工程与设计;2009年03期
2 李磊;;黑龙江邮政数据分析系统研究[J];林业科技情报;2011年04期
3 陈起榕;陈新亮;曹世彪;;一种新的数据分析系统前端展示方案[J];邮电设计技术;2012年10期
4 孟庆超;李永亮;;智能数据分析系统研究[J];现代商贸工业;2008年11期
5 郭静;;钢铁企业能源数据分析系统的构建[J];昆明理工大学学报(理工版);2009年05期
6 哈文雷;;基于云计算的油田数据分析系统[J];中国新技术新产品;2013年17期
7 黄丽丽;陈华辉;;博客数据分析系统的设计与实现[J];宁波大学学报(理工版);2008年03期
8 田月洁;焦波;谢金洲;;中药不良反应数据分析系统的设计与应用[J];中国药物警戒;2007年04期
9 毛兰斌;;基于机电结构检测的可靠性数据分析系统设计[J];中国高新技术企业;2008年08期
10 毛羽芳;王锐明;;天津市工商行政管理局数据分析系统的建设[J];信息系统工程;2010年07期
相关会议论文 前7条
1 顾红生;;浅谈汽车行业竞品数据分析系统解决方案[A];第八届中国汽车设计与研发高峰论坛论文集[C];2013年
2 辛建峰;辛阳;;数据分析系统中的自定义量度方案设计实现[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 尚屹;朱琦;;国家持久性有机污染物数据分析系统研究[A];2008中国环境科学学会学术年会优秀论文集(下卷)[C];2008年
4 郑慧娟;周嘉元;李斌;;水电站生产数据分析系统及其现场应用[A];中国水力发电工程学会信息化专委会2010年学术交流会论文集[C];2010年
5 张永忠;赵静;;基于事件检测算法的交通数据分析系统[A];2008全国第十三届自动化应用技术学术交流会论文集[C];2008年
6 王治国;王薇;訾凯;任鹏;;临床检验方法确认与性能验证数据分析系统(MVS)的开发与应用[A];中华医学会第九次全国检验医学学术会议暨中国医院协会临床检验管理专业委员会第六届全国临床检验实验室管理学术会议论文汇编[C];2011年
7 董刚;孙建林;谭耘宇;;建立梅钢热轧数据分析系统[A];自动化技术与冶金流程节能减排——全国冶金自动化信息网2008年会论文集[C];2008年
相关重要报纸文章 前8条
1 记者 刘慧敏;开发区一企业研发成功“消费行为数据分析系统”[N];宁波日报;2009年
2 别志铭;基于云的大数据分析系统[N];网络世界;2013年
3 袁毅;苏州:数据分析系统精准问诊城市交通[N];人民公安报·交通安全周刊;2011年
4 绍兴职业技术学院 沈华峰 宁波大学信息科学与工程学院 朱双东;基于可缩放矢量图形数据分析系统的设计与实现[N];中国计算机报;2010年
5 记者 董科;转型客户服务 打造全新竞争力[N];期货日报;2010年
6 江苏省淮安市涟水地税局 周跃 黄吕胜 童政;应完善税收数据分析系统提升使用效能[N];中国税务报;2013年
7 陶利军;路桥当好企业经济分析师[N];中国工商报;2007年
8 本报记者 巩国强;汛潮的“卖点”[N];山西经济日报;2004年
相关硕士学位论文 前10条
1 夷臻;学生事务数据分析系统的设计与实现[D];苏州大学;2015年
2 李永秋;智能化体检数据分析系统设计与实现[D];山东大学;2014年
3 翟羽佳;莱芜供电公司经营数据分析系统的设计与实现[D];山东大学;2015年
4 张磊磊;高考录取数据分析系统前端界面模块的设计与实现[D];山东大学;2015年
5 韩继军;金卡科技公司业务数据分析系统设计与实现[D];大连理工大学;2015年
6 张志祥;某数据分析系统的设计与实现[D];北京邮电大学;2015年
7 龙少杭;基于Storm的实时大数据分析系统的研究与实现[D];上海交通大学;2015年
8 余梦然;面向商务智能的公共交通数据分析系统的设计与实现[D];西安电子科技大学;2014年
9 张鹏宇;中国联通ERP用户感知业务监控数据分析系统的设计与实现[D];华南理工大学;2015年
10 廖宁平;石化企业数据分析系统的开发及运营管理中的应用[D];浙江工业大学;2014年
,本文编号:2228026
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2228026.html