基于Hadoop的电梯安全大数据挖掘研究
本文选题:电梯安全 切入点:数据挖掘 出处:《西安科技大学》2017年硕士论文 论文类型:学位论文
【摘要】:近年来,随着电梯的使用频率越来越高,电梯安全事故频发,由此引发的电梯安全问题引起了广泛的关注。电梯远程监管系统是一个综合性电梯管理平台,所采集到的电梯信息会通过GPRS无线网络传输到服务器。随着4G时代的到来,数据传输速率增加,数据库中积累的数据越来越多,电梯也进入了大数据时代。本课题的主要内容是基于Hadoop对海量的电梯数据进行挖掘分析,设计并实现了一个基于Hadoop的数据挖掘系统,主要包括四个模块:数据导入导出模块,数据预处理模块,数据挖掘模块和调度模块。其中,数据导入导出模块的作用是实现关系型数据库SQL Server与HDFS的数据传输;数据预处理模块的主要目的是对电梯数据进行清洗,其原因是原始的数据中包含有大量的“脏数据”,若不进行预处理会对挖掘结果造成一定的影响;数据挖掘模块是本课题的核心模块,其作用是实现对电梯数据的挖掘工作,该模块实现了两种改进的算法,一种是聚类分析算法一 K-Means,另一种是关联规则算法—Apriori。最后通过调度模块将所有的模块整合起来,使其成为一个完整的系统。本课题以电梯远程监管系统数据库中的数据作为数据源,对改进前后的两种算法分别在Hadoop平台上进行实验,并从加速比和可扩展性两方面进行了比较分析,结果表明两种改进后的算法的性能均有很大的提升。利用改进后的两种算法分别对电梯数据进行聚类分析与关联规则挖掘,不但提高了算法的效率,而且保证了数据挖掘的充分性,为电梯安全可靠性分析提供了支持。
[Abstract]:In recent years, with the increasing frequency of elevator use and frequent accidents of elevator safety, the elevator safety problems caused by it have aroused widespread concern. The elevator remote supervision system is a comprehensive elevator management platform. The elevator information collected will be transmitted to the server via the GPRS wireless network. With the arrival of the 4G era, the data transmission rate will increase, and more and more data will accumulate in the database. Elevator has also entered big data era. The main content of this subject is to mine and analyze mass elevator data based on Hadoop, and design and implement a data mining system based on Hadoop, which includes four modules: data import and export module. Data preprocessing module, data mining module and scheduling module. Among them, the function of data import and export module is to realize the data transmission between relational database SQL Server and HDFS, the main purpose of data preprocessing module is to clean elevator data. The reason is that the raw data contains a large number of "dirty data", if not pre-processing will have a certain impact on the mining results; data mining module is the core module of this topic, its role is to achieve the elevator data mining work, This module implements two improved algorithms, one is clustering analysis algorithm K-Means, the other is association rule algorithm -Apriori.Finally, all the modules are integrated by scheduling module. In this paper, the data in the database of elevator remote supervision system is used as the data source, and the two algorithms before and after the improvement are experimented on the Hadoop platform. The comparison and analysis of speedup and extensibility show that the performance of the two improved algorithms is greatly improved. The two improved algorithms are used for clustering analysis and association rule mining of elevator data respectively. It not only improves the efficiency of the algorithm, but also ensures the adequacy of data mining, and provides support for elevator safety and reliability analysis.
【学位授予单位】:西安科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13;TU857
【参考文献】
相关期刊论文 前10条
1 林穗贤;;大数据时代下的电梯预诊断[J];机电工程技术;2016年07期
2 万晓燕;陈姗;;基于关联规则的数据挖掘技术研究[J];现代计算机(专业版);2015年14期
3 赵莉;候兴哲;胡君;傅宏;孙洪亮;;基于改进k-means算法的海量智能用电数据分析[J];电网技术;2014年10期
4 王海荣;刘珂;;基于Hadoop的海量数据存储系统设计[J];科技通报;2014年09期
5 孙赵旭;谢晓兰;周国清;倪金生;胡莘;;基于Hadoop的Apriori算法与实现[J];桂林理工大学学报;2014年03期
6 李社;;积极发展大数据产业[J];理论与当代;2014年08期
7 颜丰;张琳;;一种混合模式的协同过滤算法[J];现代计算机(专业版);2014年14期
8 王鑫;王喻红;于娇;葛冬梅;;MapReduce框架下Aprioi算法的改进[J];黑龙江工程学院学报;2014年02期
9 吕本富;陈健;;大数据预测研究及相关问题[J];科技促进发展;2014年01期
10 陈吉荣;乐嘉锦;;基于Hadoop生态系统的大数据解决方案综述[J];计算机工程与科学;2013年10期
相关硕士学位论文 前10条
1 胡琴琴;基于Hadoop的数据可视化技术研究与应用[D];北方工业大学;2016年
2 苏蓉;基于Hadoop平台的安全日志聚类挖掘算法研究与应用[D];西北大学;2015年
3 李芳;K-Means算法的k值自适应优化方法研究[D];安徽大学;2015年
4 刘荣灿;电梯安全远程监管系统终端的研制[D];西安科技大学;2014年
5 柳玉巧;聚类分析和关联规则技术在成绩分析中的研究及应用[D];华中师范大学;2014年
6 刘书志;基于密度的局部离群数据挖掘方法的研究和改进[D];重庆大学;2014年
7 范小刚;基于k近邻树的离群检测算法研究[D];重庆大学;2014年
8 胡婷婷;数据挖掘中的离群点检测算法研究[D];厦门大学;2014年
9 杨超;Apriori关联规则挖掘算法在高校教学管理系统中的应用研究[D];电子科技大学;2013年
10 程艳柳;基于云计算的智能电网数据挖掘的研究[D];华北电力大学;2013年
,本文编号:1630536
本文链接:https://www.wllwen.com/jianzhugongchenglunwen/1630536.html