基于Weka大数据挖掘方法在地震前兆数据处理中的应用
本文选题:地震前兆数据 切入点:大数据挖掘 出处:《太原理工大学》2017年硕士论文 论文类型:学位论文
【摘要】:随着全球信息技术和互联网技术的快速发展,各行业的数据信息迅猛增长,对于地震的相关科研趋势亦是如此,继而使大数据和大数据挖掘技术在地震监测数据的研究领域引起人们的普遍重视。大数据本身蕴含的庞大潜在价值促进了大数据挖掘技术的产生,从具有容量大、多样性、高速更新和潜在价值无穷尽的地震数据中挖掘出具有意义的知识将成为研究的重点。在国家“十五”数字化、网络化改造前兆台网监测系统后,地震前兆数据的产出大大激增,半人工的传统数据处理方法已经不能满足实际的工作需要。本文主要以太原市2011-2016年地震前兆形变数据为数据挖掘对象,以大数据挖掘的基本思想方法,主要开展以下两项研究内容:首先,对于前兆数据预处理,利用基于JAVA开发的开源的数据挖掘软件Weka工具,主要重新安装设置了Forecast环境,其原理主要为时间序列的前兆数据按其趋势建立模型来补充小数量的缺失数据,计算出的数据本为预测数据,此方法将预测结果作为插值数据,对于地震前兆数据的预处理工作具有促进作用。其次,本文有效采用了Weka便利的开放特征,针对地震前兆数据测项特点,将适用大数据特征的DFCM(基于密度函数加权的模糊聚类算法)通过工具MyEclipse植入到同是JAVA开发的Weka运行环境中,在Weka工作界面内充分发挥该算法的作用,将各个测项数据进行客观模糊聚类分析,最终得出以下结论:首先,针对前兆各个测项数据变化复杂多样、易缺失的情况,数据预处理部分重点研究了时间序列插值处理方法,设置利用的Weka-Forecast插值法对缺失数据进行处理,并和行业其他研究成果的插值结果进行比较,比较的标准是通过平均标准误差的大小,结果说明Weka-Forecast插值法较其他常见插值方法适用性更好,重点是插值原理适用时间序列的前兆数据且操作简单。其次,地震前兆数据在Weka中的聚类分析得以实现,植入的模糊聚类算法通过改变参数寻找相对良好的并符合实际意义的聚类结果。实验数据中,大部分测项数据可以被检测出异常数据,与半人工的检测标准对比,其准确率良好。本文创新点在于地震前兆数据的大数据挖掘研究是时代发展必然需求,从聚类分析方法入手,挖掘出尚未被认知的规律或者对已有规律的新认知,利用这种新思路、新模式,结合有效的数据挖掘工具,并能初步尝试实现这种思路的具体分析过程,最终根据前兆数据的具体意义,确认发展规律,对于以前兆数据为基础研究的科研问题具有一定意义。
[Abstract]:With the rapid development of global information technology and Internet technology, the data and information of various industries are growing rapidly, and so is the trend of earthquake related scientific research. Thus, big data and big data mining techniques have attracted widespread attention in the research field of seismic monitoring data. The huge potential value contained in big data itself has promoted the production of big data mining technology, which has a large capacity and diversity. Mining meaningful knowledge from seismic data of high speed updating and endless potential value will become the focus of research. After the national "15" digitization and network transformation of precursor network monitoring system, the output of seismic precursor data has greatly increased. The semi-artificial traditional data processing method can no longer meet the practical needs. This paper mainly takes the earthquake precursor deformation data from 2011 to 2016 in Taiyuan as the data mining object, and takes the basic thinking method of big data mining as the main data mining object. The main research contents are as follows: first of all, for precursor data preprocessing, using the open source data mining software Weka tool based on JAVA, it mainly reinstates and sets up the Forecast environment. The principle is that the precursor data of time series is modeled according to its trend to supplement a small amount of missing data, and the calculated data is predicted data. The method takes the prediction results as interpolation data. It can promote the preprocessing of seismic precursor data. Secondly, this paper effectively adopts the open feature of Weka, aiming at the characteristics of seismic precursor data. The fuzzy clustering algorithm based on density function weighting (DFCM), which is suitable for big data feature, is implanted into the Weka running environment which is also developed by JAVA through the tool MyEclipse, and the function of the algorithm is brought into full play in the Weka working interface. The objective fuzzy clustering analysis of each item data is carried out, and the following conclusions are drawn: first of all, in view of the complex and diverse changes of the precursor data, the data preprocessing part focuses on the time series interpolation processing method. Set up the Weka-Forecast interpolation method to process the missing data, and compare with the interpolation results of other research results in the industry. The standard of comparison is through the size of the average standard error. The results show that the Weka-Forecast interpolation method is more applicable than other common interpolation methods. The emphasis is that the interpolation principle is applicable to the precursor data of time series and the operation is simple. Secondly, the clustering analysis of seismic precursor data in Weka is realized. The embedded fuzzy clustering algorithm can change the parameters to find the relatively good clustering results which accord with the practical significance. In the experimental data, most of the test data can be detected abnormal data, which is compared with the semi-artificial detection standard. The innovation of this paper is that the research of big data mining earthquake precursor data is the inevitable demand of the development of the times. Starting with the cluster analysis method, we can find out the laws that have not been recognized or the new cognition of the existing laws. Using this new idea, new model, effective data mining tools, and can initially try to realize the specific analysis process of this idea, finally according to the specific significance of precursor data, confirm the development law, It has a certain significance for the scientific research on the basis of precursor data.
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:P315.72;TP311.13
【相似文献】
相关期刊论文 前10条
1 曹凤娟,谷光裕,牛峰,魏柳,吴镝;地震前兆数据传输与处理系统的建立[J];东北地震研究;2000年01期
2 李圣强,杨满栋,米宏亮,李闽峰,姜立新,宋喜先,赵育浦;地震前兆数据的管理与服务[J];地震;2001年04期
3 李兴坚,陈兰新,尹亮,刘晓明,陈建军,武银,刘鸿斌,李东生,许玉红;地震前兆数字化公用设备常见故障检查与处理[J];高原地震;2001年04期
4 ;电器异常也可能是地震前兆[J];新农业;2001年12期
5 程光华;新疆地震前兆台站(网)技术改造项目通过验收[J];内陆地震;2002年01期
6 王行舟,李立凤,蒋春曦,王洋;安徽省地震前兆数据纠错软件[J];地震地磁观测与研究;2003年05期
7 陈述新,朱燕;地震前兆数据库软件的使用[J];内陆地震;2003年03期
8 王凤;地震前兆台站的防雷[J];灾害学;2005年02期
9 王秀英;周振安;丁晗;;网络通讯技术在地震前兆仪器中的应用探讨[J];华北地震科学;2005年04期
10 李炜;王利科;杨静;陈曦序;刘锐;;青岛市地震前兆台站监测现状及监控能力分析[J];国际地震动态;2006年04期
相关会议论文 前10条
1 杨军;田韬;卢永;;用于地震前兆探测的岩石声发射技术[A];中国地震学会成立三十年学术研讨会论文摘要集[C];2009年
2 陆坤权;厚美瑛;王强;彭政;孙威;孙晓明;王玉莹;佟晓辉;姜泽辉;刘寄星;;颗粒介质中探测地震前兆和前兆应力-应变传播模型[A];第七届全国液体和软物质物理学术会议程序册及论文摘要集[C];2010年
3 周硕愚;张荣富;;地震前兆普适特性的研究[A];1990年中国地球物理学会第六届学术年会论文集[C];1990年
4 张肇诚;王贵宣;郑大林;;地震前兆含义、科学问题与研究途径的研讨[A];中国地震学会第六次学术大会论文摘要集[C];1996年
5 陈棋福;;地震前兆资料的分形特征及可预报尺度[A];1991年中国地球物理学会第七届学术年会论文集[C];1991年
6 谢华章;田建明;黄耘;郑江蓉;孙春仙;;华东地区中短期地震前兆的区域特征[A];中国地震学会第八次学术大会论文摘要集[C];2000年
7 周振安;;地震前兆数据采集器的可靠性分析[A];中国地震学会第八次学术大会论文摘要集[C];2000年
8 陈学忠;王晓青;;强震前短临地震前兆时空分布非均匀性变化特征[A];中国地震学会第九次学术大会论文摘要集——纪念李善邦先生百年诞辰[C];2002年
9 武安绪;吴培稚;兰从欣;樊智勇;;经验模态分解在地震前兆资料分析中的应用[A];新方法和新技术在地震预报中的应用暨中国东部地区震情研讨会论文摘要集[C];2004年
10 郑治真;刘元壮;胡祚春;于光;吴大铭;;非稳态最优线性滤波及其应用和地震前兆资料分析中的数学方法[A];中国地震学会第二届代表大会暨学术年会论文摘要汇编[C];1984年
相关重要报纸文章 前8条
1 ;州地震局提示 近期我州境内无任何地震前兆[N];祁连山报;2010年
2 李涛涛;湘乡市地震前兆台省评获奖[N];湘潭日报;2007年
3 李学梅;科学家发现1999年土耳其大地震前兆[N];中国国土资源报;2011年
4 记者史雪红;观测地震前兆州直设百个宏观观测点[N];伊犁日报(汉);2011年
5 记者 王悠璐 实习生 钟智;宜宾自贡拟共建地震前兆监测网[N];宜宾日报;2013年
6 记者 唐伟;研讨地震前兆数据分析工作[N];湄洲日报;2010年
7 本报记者 张晔 通讯员 贾冰;极端天气中能否发现地震前兆?[N];科技日报;2011年
8 本报记者 贾西平;迈向新世纪的科技会战[N];人民日报;2001年
相关博士学位论文 前1条
1 刘子维;地震前兆数据异常识别关键技术研究[D];武汉大学;2016年
相关硕士学位论文 前10条
1 王洪伟;基于Weka大数据挖掘方法在地震前兆数据处理中的应用[D];太原理工大学;2017年
2 张e,
本文编号:1590603
本文链接:https://www.wllwen.com/kejilunwen/diqiudizhi/1590603.html