当前位置:主页 > 科技论文 > 矿业工程论文 >

基于数据挖掘的煤矿微震危害预测实证分析

发布时间:2018-09-09 17:21
【摘要】:数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程[1]。数据挖掘作为基于统计学习理论的新的学习技术,是近年来数据应用领域中相当热门的研究课题之一,已成为统计学、机器学习等诸多领域的研究热点,数据挖掘技术已成为大数据时代最热门的技术。因此,近年来数据挖掘理论得到深入研究,并在建模、预测与控制等诸多领域得到了广泛的应用。冲击矿压是引起煤矿微震的主要原因,是矿山井巷和采场周围煤岩体由于变形能释放而产生的以突然、急剧、猛烈的破坏为特征的动力现象[2]。即,井下煤岩体在开挖扰动下,应力重分布过程中煤岩体破裂会产生以弹性波形式突然释放的变形能,震级一般小于3级。煤矿微震发生的实质是煤矿岩体的非线性以及非连续性破坏的过程[3][4],具有典型的非线性非连续特征,因此,煤矿微震过程的复杂性导致一般的线性模型无法有效的预测微震灾害。本文运用数据挖掘技术去研究在高能量(JE4?10)情况下煤矿微震灾害的预测问题。数据集为波兰某煤矿每8小时监测一次的能量和脉冲的实时数据[5][6],选自UCI机器学习数据库中的seismic-bumps数据集。针对这些数据,以机器学习法中的k最近邻法、决策树、adaboost分类、支持向量机和随机森林为主,用五折交叉验证的标准化均方误差(NMSE)的大小来判断各种机器学习法结果的可靠性,比较各种算法的NMSE值和对数据集的预测精度来分析各算法的优劣性,并选出最适合的算法。采用R软件对数据集进行处理[7-9],实现五折交叉验证的NMSE和各机器算法建模分析的R语言编程。研究发现k最近邻方法、决策树、adaboost分类、支持向量机和随机森林对处理高能量煤矿微震数据都具有较好的误差容忍性,分类效果理想,其中随机森林对多样本、高维度的煤矿微震预测问题能很好的控制误差,预测精度高。关于高能量情况下煤矿微震灾害的预测问题,随机森林效果最理想。本文的研究得出,高能量震动事件是煤矿微震发生的必要条件,数据挖掘运用于煤矿微震的监测数据分析上是切实可行的,对煤矿微震监测数据进行数据挖掘,分析各因素间潜在的联系,找出煤矿微震的致灾机理和发生的规律。本文所提出的煤矿微震预测模型对微震事件虽然不能全部做出准确的预报,有一定的漏报和误报,但还是可以识别和预报出相当一部分煤矿微震事件,这为防震减灾工作提供了参考,也为数据挖掘应用于煤矿微震灾害预测提供了新思路。
[Abstract]:Data mining (Data Mining) is a process of extracting hidden, unknown, but potentially useful information and knowledge from a large number of, incomplete, noisy, fuzzy and random practical data. As a new learning technology based on statistical learning theory, data mining is one of the most popular research topics in the field of data application in recent years, and has become a hot research topic in many fields such as statistics, machine learning and so on. Data mining technology has become the most popular technology in big data era. Therefore, the theory of data mining has been deeply studied in recent years, and has been widely used in many fields such as modeling, prediction and control. Rock burst is the main cause of micro-earthquake in coal mine, and it is the dynamic phenomenon caused by sudden, sharp and violent destruction of coal and rock mass around mine roadway and stope due to the release of deformation energy [2]. That is to say under the disturbance of excavation the fracture of coal and rock mass in the process of stress redistribution will result in the sudden release of deformation energy in the form of elastic wave and the magnitude of the earthquake is generally less than 3. The essence of the occurrence of coal mine microearthquakes is the process of nonlinearity and discontinuity failure of rock mass in coal mine [3] [4], which has typical nonlinear discontinuous characteristics. Because of the complexity of microseismic process in coal mine, the general linear model can not effectively predict the microseismic disaster. In this paper, data mining technology is used to study the prediction of coal mine microseismic disaster under the condition of high energy (JE4?10). The data set is the real time data of energy and pulse monitored every 8 hours in a coal mine in Poland [5] [6], selected from the seismic-bumps data set in UCI machine learning database. For these data, the k nearest neighbor method of machine learning, decision tree adaboost classification, support vector machine and random forest are used to judge the reliability of the results of various machine learning methods with the magnitude of standardized mean square error (NMSE) of 50% discount cross-validation. By comparing the NMSE values of various algorithms and the prediction accuracy of data sets, the advantages and disadvantages of each algorithm are analyzed, and the most suitable algorithm is selected. The data set is processed by R software [7-9], and 50% discount cross-validation NMSE and R language programming for modeling and analysis of each machine algorithm are realized. It is found that k-nearest neighbor method, decision tree adaboost classification, support vector machine and random forest have good tolerance to deal with high-energy coal mine microseismic data, and the classification effect is ideal. The high dimensional micro-earthquake prediction problem can control the error well and the prediction accuracy is high. The stochastic forest effect is the most ideal for the prediction of coal mine microseismic disaster under high energy condition. In this paper, it is concluded that the high energy earthquake event is the necessary condition for the occurrence of the coal mine microearthquake, and it is feasible to apply data mining to the analysis of the monitoring data of the mine microearthquake, and the data mining for the monitoring data of the coal mine microearthquake is carried out. This paper analyzes the potential relationship among various factors and finds out the mechanism and occurrence law of coal mine microearthquakes. Although the prediction model proposed in this paper can not make accurate prediction of all micro-earthquake events, but it can still identify and predict a considerable number of micro-earthquake events in coal mines. It provides a reference for earthquake prevention and disaster reduction, and also provides a new idea for the application of data mining in the prediction of coal mine microseismic disaster.
【学位授予单位】:云南师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TD326;TP311.13

【相似文献】

相关期刊论文 前10条

1 陈修宽;董祥军;石芙芙;;Web数据挖掘综述[J];山东轻工业学院学报(自然科学版);2009年03期

2 黄会明;王红星;;SQL Server 2005在数据挖掘中的应用[J];煤炭技术;2011年06期

3 吴孝丽;周焱;;Microsoft SQL Server数据挖掘的高级研究[J];煤炭技术;2011年07期

4 糜元根;数据挖掘方法的评述[J];南京化工大学学报(自然科学版);2001年05期

5 李小平,焦李成;数据挖掘中信息颗粒及其构造[J];西安石油学院学报(自然科学版);2001年04期

6 秦忠宝,彭文利,何卫平,陈伟东;网络环境下数据挖掘若干问题的述评[J];西北轻工业学院学报;2002年02期

7 叶克江,陈广宇;数据挖掘的实现方法及其应用[J];郑州轻工业学院学报;2002年03期

8 高磊红,骆舒心,仇记清,雷和稳,段惠敏;一类复杂工业生产过程中的数据挖掘[J];河北化工;2003年06期

9 乔淑云;数据挖掘[J];江苏煤炭;2003年04期

10 谭立云,高学东,武森;数据挖掘方法与应用[J];华北科技学院学报;2004年02期

相关会议论文 前10条

1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年

3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年

4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年

5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年

6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年

7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年

9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年

10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

相关重要报纸文章 前10条

1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年

2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年

3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年

4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年

5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年

6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年

7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年

8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年

9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年

10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年

相关博士学位论文 前10条

1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年

2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年

3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年

4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年

5 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年

6 李玉华;面向服务的数据挖掘关键技术研究[D];华中科技大学;2006年

7 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年

8 王珊珊;知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用[D];中国科学技术大学;2009年

9 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年

10 陈平;数据挖掘网格若干关键技术研究[D];北京邮电大学;2007年

相关硕士学位论文 前10条

1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年

2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年

3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年

4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年

5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年

6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年

7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年

8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年

9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年

10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年



本文编号:2233064

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/kuangye/2233064.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户549f8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com