基于文本挖掘的煤矿事故隐患排查信息系统应用研究
发布时间:2022-02-24 22:21
近十年来,我国煤矿安全事故数量和百万吨死亡率实现了逐年“双下降”。尽管如此,煤矿安全事故仍屡有发生,煤矿安全亟需重视。实现煤矿事故隐患排查治理形成长效机制,构建煤矿事故隐患排查信息系统,防范隐患未及时排查和治理而演变成为事故。本文通过分析煤矿事故隐患理论研究,并结合宏源煤业实际情况,深入研究了煤矿事故隐患排查治理体系框架及文本挖掘对煤矿隐患文本数据的分析应用。主要研究成果有:(1)研究了安全生产事故隐患理论,通过对煤矿事故隐患进行排查治理,可以有效降低事故因素的危险状态,减少事故的发生。阐述了煤矿事故隐患的分级分类和辨识方法,引入了PDCA闭环管理理论。构建了煤矿事故隐患排查治理体系框架,同时也为煤矿隐患排查信息系统的研究开发奠定了基础。(2)目前,煤矿事故隐患信息系统功能主要集中在隐患排查治理过程管控层面,忽视了挖掘隐患文本数据揭示煤矿隐患管理薄弱环节的价值研究。据此,对煤矿事故隐患文本进行了预处理研究,利用R语言的jiebaR包进行隐患文本分词,构建了煤矿事故隐患用户词典,扩充了隐患停用词表,采用向量空间模型对隐患文本信息进行表示。(3)引入文本挖掘技术,利用主题模型和关联规则对煤...
【文章来源】:中国矿业大学江苏省211工程院校教育部直属院校
【文章页数】:99 页
【学位级别】:硕士
【图文】:
隐患文本默认词典分词结果
3隐患样本分析及文本挖掘预处理29可以看出分词结果中存在多处分词不准确的地方,以“静压水管”和“三采区”为例,其原因是jiebaR包提供的默认标准词典不含有这些专业名词和采矿工程现场相关的词语。使用煤矿事故隐患用户词典分词结果如图3-4所示。图3-4隐患文本用户词典分词结果Figure3-4Hiddendangertextuserdictionarywordsegmentationresults对比图3-3可以看出,在丰富过后的用户词典的帮助下可以得到更为精确的分词结果,尤其是隐患地点,例如“1234运输巷”和“1236轨道巷”,以及采矿工程专业名词,以“下浮煤”和“超前支护”为例。为了得到准确的文本分析和挖掘效果,实现准确分词是极为重要的一步,其中关键的一步就是不断扩充用户词典。三、去停用词处理。根据jiebaR分词得到的分词结果去停用词,去除“处”、“号”、“于”、“与”等连接词、介词、冠词以及数字和标点符号,降低分词结果特征项的维度,提高文本分析的准确率和运算速度。去停用词后的部分结果如图3-5所示。图3-5隐患文本去停用词结果Figure3-5Hiddendangertextdeletingstopwordresults四、构建隐患文本语料库。3900条煤矿事故隐患文本信息构成语料库,以原有的形式保存在计算机中,语料库为后续文本挖掘操作提供基矗R语言tm包提供了语料库构建的功能,运行结果如图3-6。
3隐患样本分析及文本挖掘预处理29可以看出分词结果中存在多处分词不准确的地方,以“静压水管”和“三采区”为例,其原因是jiebaR包提供的默认标准词典不含有这些专业名词和采矿工程现场相关的词语。使用煤矿事故隐患用户词典分词结果如图3-4所示。图3-4隐患文本用户词典分词结果Figure3-4Hiddendangertextuserdictionarywordsegmentationresults对比图3-3可以看出,在丰富过后的用户词典的帮助下可以得到更为精确的分词结果,尤其是隐患地点,例如“1234运输巷”和“1236轨道巷”,以及采矿工程专业名词,以“下浮煤”和“超前支护”为例。为了得到准确的文本分析和挖掘效果,实现准确分词是极为重要的一步,其中关键的一步就是不断扩充用户词典。三、去停用词处理。根据jiebaR分词得到的分词结果去停用词,去除“处”、“号”、“于”、“与”等连接词、介词、冠词以及数字和标点符号,降低分词结果特征项的维度,提高文本分析的准确率和运算速度。去停用词后的部分结果如图3-5所示。图3-5隐患文本去停用词结果Figure3-5Hiddendangertextdeletingstopwordresults四、构建隐患文本语料库。3900条煤矿事故隐患文本信息构成语料库,以原有的形式保存在计算机中,语料库为后续文本挖掘操作提供基矗R语言tm包提供了语料库构建的功能,运行结果如图3-6。
【参考文献】:
期刊论文
[1]煤矿隐患排查信息管理系统研究现状与展望[J]. 张俭让,黄玉鑫,闫振国,张磊,霍小泉. 工矿自动化. 2019(11)
[2]煤矿通风安全隐患预防的措施探讨[J]. 孔五洲. 科学技术创新. 2019(28)
[3]煤矿机电运输安全管理及隐患预防研究[J]. 王庆文. 中国标准化. 2019(18)
[4]浅谈“三位一体”安全生产标准化体系建设与创新[J]. 牛彦伟. 煤. 2019(09)
[5]煤矿井下采掘安全隐患及管理措施分析[J]. 牛春雨. 内蒙古煤炭经济. 2019(15)
[6]智慧矿山框架与发展前景研究[J]. 赵明磊. 科学技术创新. 2019(23)
[7]基于文本挖掘的物探作业事故分析方法[J]. 王明达,陈泼,陈子新,韦永健,徐宗辉. 西安石油大学学报(自然科学版). 2019(04)
[8]“三位一体”安全生产标准化工作体系的创建与实施[J]. 郭东杰,秦海忠,陈宁. 中国煤炭工业. 2019(07)
[9]美国煤矿安全风险管控和隐患排查治理[J]. 孙洪灵. 劳动保护. 2019(07)
[10]防风险除隐患遏事故 确保煤矿安全生产形势持续好转[J]. 黄盛初. 煤炭经济研究. 2019(06)
博士论文
[1]煤矿事故隐患排查与管控关键技术及应用研究[D]. 韦钊.中国矿业大学(北京) 2018
[2]基于数据挖掘的煤矿安全管理知识可视化研究[D]. 陈晓.中国矿业大学(北京) 2017
[3]基于流程化的煤矿安全生产风险控制系统研究[D]. 邹向炜.中国矿业大学(北京) 2015
硕士论文
[1]我国煤矿双重预防机制建设研究[D]. 王语萌.华北科技学院 2019
[2]基于病历数据的文本挖掘研究与实现[D]. 杜宝琛.北京邮电大学 2019
[3]露天煤矿安全隐患排查治理系统研究与应用[D]. 李靖.华北科技学院 2019
[4]肖家洼煤矿双控体系的建立及应用研究[D]. 张瑞.中国矿业大学 2019
[5]煤矿安全风险分级管控及事故隐患排查治理管理系统设计与实现[D]. 雷小平.江西财经大学 2018
[6]郭家湾煤矿安全风险管控及隐患排查信息系统研究[D]. 邵广桐.西安科技大学 2018
[7]面向笔记本电脑网络用户需求的短文本挖掘工具设计研究[D]. 冷少伟.华南理工大学 2018
[8]基于文本挖掘的船舶碰撞事故分析及防控对策研究[D]. 吴伋.武汉理工大学 2018
[9]基于文本数据的铁路道岔故障预测[D]. 王广.北京交通大学 2017
[10]基于语义的地铁施工安全隐患知识建模及应用研究[D]. 滕哲.华中科技大学 2016
本文编号:3643609
【文章来源】:中国矿业大学江苏省211工程院校教育部直属院校
【文章页数】:99 页
【学位级别】:硕士
【图文】:
隐患文本默认词典分词结果
3隐患样本分析及文本挖掘预处理29可以看出分词结果中存在多处分词不准确的地方,以“静压水管”和“三采区”为例,其原因是jiebaR包提供的默认标准词典不含有这些专业名词和采矿工程现场相关的词语。使用煤矿事故隐患用户词典分词结果如图3-4所示。图3-4隐患文本用户词典分词结果Figure3-4Hiddendangertextuserdictionarywordsegmentationresults对比图3-3可以看出,在丰富过后的用户词典的帮助下可以得到更为精确的分词结果,尤其是隐患地点,例如“1234运输巷”和“1236轨道巷”,以及采矿工程专业名词,以“下浮煤”和“超前支护”为例。为了得到准确的文本分析和挖掘效果,实现准确分词是极为重要的一步,其中关键的一步就是不断扩充用户词典。三、去停用词处理。根据jiebaR分词得到的分词结果去停用词,去除“处”、“号”、“于”、“与”等连接词、介词、冠词以及数字和标点符号,降低分词结果特征项的维度,提高文本分析的准确率和运算速度。去停用词后的部分结果如图3-5所示。图3-5隐患文本去停用词结果Figure3-5Hiddendangertextdeletingstopwordresults四、构建隐患文本语料库。3900条煤矿事故隐患文本信息构成语料库,以原有的形式保存在计算机中,语料库为后续文本挖掘操作提供基矗R语言tm包提供了语料库构建的功能,运行结果如图3-6。
3隐患样本分析及文本挖掘预处理29可以看出分词结果中存在多处分词不准确的地方,以“静压水管”和“三采区”为例,其原因是jiebaR包提供的默认标准词典不含有这些专业名词和采矿工程现场相关的词语。使用煤矿事故隐患用户词典分词结果如图3-4所示。图3-4隐患文本用户词典分词结果Figure3-4Hiddendangertextuserdictionarywordsegmentationresults对比图3-3可以看出,在丰富过后的用户词典的帮助下可以得到更为精确的分词结果,尤其是隐患地点,例如“1234运输巷”和“1236轨道巷”,以及采矿工程专业名词,以“下浮煤”和“超前支护”为例。为了得到准确的文本分析和挖掘效果,实现准确分词是极为重要的一步,其中关键的一步就是不断扩充用户词典。三、去停用词处理。根据jiebaR分词得到的分词结果去停用词,去除“处”、“号”、“于”、“与”等连接词、介词、冠词以及数字和标点符号,降低分词结果特征项的维度,提高文本分析的准确率和运算速度。去停用词后的部分结果如图3-5所示。图3-5隐患文本去停用词结果Figure3-5Hiddendangertextdeletingstopwordresults四、构建隐患文本语料库。3900条煤矿事故隐患文本信息构成语料库,以原有的形式保存在计算机中,语料库为后续文本挖掘操作提供基矗R语言tm包提供了语料库构建的功能,运行结果如图3-6。
【参考文献】:
期刊论文
[1]煤矿隐患排查信息管理系统研究现状与展望[J]. 张俭让,黄玉鑫,闫振国,张磊,霍小泉. 工矿自动化. 2019(11)
[2]煤矿通风安全隐患预防的措施探讨[J]. 孔五洲. 科学技术创新. 2019(28)
[3]煤矿机电运输安全管理及隐患预防研究[J]. 王庆文. 中国标准化. 2019(18)
[4]浅谈“三位一体”安全生产标准化体系建设与创新[J]. 牛彦伟. 煤. 2019(09)
[5]煤矿井下采掘安全隐患及管理措施分析[J]. 牛春雨. 内蒙古煤炭经济. 2019(15)
[6]智慧矿山框架与发展前景研究[J]. 赵明磊. 科学技术创新. 2019(23)
[7]基于文本挖掘的物探作业事故分析方法[J]. 王明达,陈泼,陈子新,韦永健,徐宗辉. 西安石油大学学报(自然科学版). 2019(04)
[8]“三位一体”安全生产标准化工作体系的创建与实施[J]. 郭东杰,秦海忠,陈宁. 中国煤炭工业. 2019(07)
[9]美国煤矿安全风险管控和隐患排查治理[J]. 孙洪灵. 劳动保护. 2019(07)
[10]防风险除隐患遏事故 确保煤矿安全生产形势持续好转[J]. 黄盛初. 煤炭经济研究. 2019(06)
博士论文
[1]煤矿事故隐患排查与管控关键技术及应用研究[D]. 韦钊.中国矿业大学(北京) 2018
[2]基于数据挖掘的煤矿安全管理知识可视化研究[D]. 陈晓.中国矿业大学(北京) 2017
[3]基于流程化的煤矿安全生产风险控制系统研究[D]. 邹向炜.中国矿业大学(北京) 2015
硕士论文
[1]我国煤矿双重预防机制建设研究[D]. 王语萌.华北科技学院 2019
[2]基于病历数据的文本挖掘研究与实现[D]. 杜宝琛.北京邮电大学 2019
[3]露天煤矿安全隐患排查治理系统研究与应用[D]. 李靖.华北科技学院 2019
[4]肖家洼煤矿双控体系的建立及应用研究[D]. 张瑞.中国矿业大学 2019
[5]煤矿安全风险分级管控及事故隐患排查治理管理系统设计与实现[D]. 雷小平.江西财经大学 2018
[6]郭家湾煤矿安全风险管控及隐患排查信息系统研究[D]. 邵广桐.西安科技大学 2018
[7]面向笔记本电脑网络用户需求的短文本挖掘工具设计研究[D]. 冷少伟.华南理工大学 2018
[8]基于文本挖掘的船舶碰撞事故分析及防控对策研究[D]. 吴伋.武汉理工大学 2018
[9]基于文本数据的铁路道岔故障预测[D]. 王广.北京交通大学 2017
[10]基于语义的地铁施工安全隐患知识建模及应用研究[D]. 滕哲.华中科技大学 2016
本文编号:3643609
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3643609.html
最近更新
教材专著