基于数据挖掘的生产事故破坏程度评估系统研究与实现
本文选题:数据整合 切入点:离群点检测 出处:《中国科学院大学(中国科学院沈阳计算技术研究所)》2017年硕士论文 论文类型:学位论文
【摘要】:随着大数据与数据挖掘等技术的发展,越来越多的信息系统接入了数据挖掘的技术,如语音模拟、图像识别等等。本文提出了在生产事故破坏程度评估系统引入数据挖掘技术,根据外部数据、危险源自身特征以及历史数据训练分类器,对生产事故破坏程度得到比较精确的评估结果。本文主要研究内容有以下几点:1.数据整合。在面对多源异构数据整合并且要求实时性的时候,传统方案中并没有很好的解决实时性需求。本文提出了新的数据整合流程,增加了监控数据、自动更新以及知识公式库模块。2.数据整合过程中异常问题的处理。在众多数据整合方案中,往往出现数据异常问题,导致整合效果减弱。本文提出了基于角度的三阶段异常检测算法,有效地解决异常问题,也避免出现可能被误判的的异常数据。3.基于K邻近算法的改进与应用。在生产事故破坏度评估系统中,为了得到快速高效的分类器,本文提出了基于K邻近算法的改进方案,将样本集进行组织分区,压缩样本集数量,从而减少了与样本集的相似性计算。4.工厂事故破坏度系统的设计与实现。本文给出了该系统核心模块的数据接口设计以及部分源代码实现样例,然后展示了采用数据可视化形式的系统页面效果,最后进行了系统性能测试。
[Abstract]:With the development of big data and data mining technology, more and more information systems are integrated into data mining technology, such as voice simulation, image recognition and so on. Training classifiers based on external data, risk source characteristics and historical data, The main contents of this paper are as follows: 1. Data integration. In the face of multi-source heterogeneous data integration and real-time requirements, The traditional scheme does not solve the real-time requirement well. In this paper, a new data integration process is proposed, and the monitoring data is added. Automatic updating and knowledge formula database module .2. handling of abnormal problems in the process of data integration. In many data integration schemes, there are often abnormal data problems, In this paper, a three-stage anomaly detection algorithm based on angle is proposed to solve the anomaly problem effectively. In order to obtain a fast and efficient classifier, this paper proposes an improved scheme based on K-neighborhood algorithm in order to obtain a fast and efficient classifier in order to avoid the occurrence of abnormal data that may be misjudged. 3. In order to obtain a fast and efficient classifier in the evaluation system of failure degree of production accidents, this paper proposes an improved scheme based on K-neighbor algorithm. The sample set is organized and partitioned, and the number of samples is compressed. Therefore, the similarity calculation with the sample set is reduced. 4. The design and implementation of the factory accident damage degree system. This paper presents the data interface design of the core module of the system and some examples of the source code implementation. Then the system page effect of data visualization is demonstrated, and the system performance test is carried out at last.
【学位授予单位】:中国科学院大学(中国科学院沈阳计算技术研究所)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.52;TP311.13
【参考文献】
相关期刊论文 前10条
1 汪旭光;王尹军;;构建“互联网+大数据”模式 大力提升危险化学品管控和应急救援能力(一)[J];中国消防;2017年Z1期
2 张兴凯;;我国“十二五”期间生产安全死亡事故直接经济损失估算[J];中国安全生产科学技术;2016年06期
3 周德红;冯豪;李文;刘越;张明;;火灾爆炸后果分析法在LNG储罐风险评估中的应用[J];工业安全与环保;2015年10期
4 邓侃;欧智坚;;深层神经网络语音识别自适应方法研究[J];计算机应用研究;2016年07期
5 张玲;刘波;;基于残差统计的时间序列加性离群点检测算法研究[J];电子技术应用;2015年09期
6 唐成华;刘鹏程;汤申生;谢逸;;基于特征选择的模糊聚类异常入侵行为检测[J];计算机研究与发展;2015年03期
7 陈明;;大数据可视化分析[J];计算机教育;2015年05期
8 程杰;;基于欧式距离平均值的离群点自动检测算法[J];电脑知识与技术;2015年07期
9 董文斌;樊涛;;浅析数据整合方法在水利工程施工设计中的运用[J];黑龙江科技信息;2014年04期
10 钱同明;;如何做好企业(机械制造)企业危险源的管理监控[J];低碳世界;2013年22期
相关博士学位论文 前1条
1 李方媛;重特大道路交通事故致因机理及其风险行为研究[D];长安大学;2014年
相关硕士学位论文 前10条
1 张友强;基于选择性集成学习的离群点检测研究[D];青岛科技大学;2016年
2 刘静;可变模糊集理论在重大危险源安全评估中的应用[D];西安科技大学;2015年
3 周莹莹;利用离群点检测改进协同过滤推荐算法[D];南京邮电大学;2015年
4 孙科;基于Spark的机器学习应用框架研究与实现[D];上海交通大学;2015年
5 刘杨;动态检重系统数据处理算法的研究[D];中国计量学院;2014年
6 杜本汉;基于霍夫变换和条件随机场模型的目标检测[D];上海交通大学;2014年
7 蔡加欣;半监督学习及其在MR图像分割中的应用[D];南方医科大学;2011年
8 郑鲁宁;基于逆向云理论的入侵检测评定方法研究[D];兰州理工大学;2009年
9 孙晓霞;聚类分析在客户细分领域的应用研究[D];西北大学;2006年
10 罗松涛;基于GEP挖掘的战争函数模型及应用[D];四川大学;2006年
,本文编号:1596371
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1596371.html