当前位置:主页 > 科技论文 > 矿业工程论文 >

基于LDA的煤矿事故调查报告主题发现研究

发布时间:2024-02-20 21:25
  近年来,我国重特大煤矿安全事故频发,其造成死伤人数多,经济损失大,影响极其恶劣,引起广大社会群众关注。事故发生后,由相关政府部门牵头,成立了事故调查小组,聘请有关专家一同对事故进行调查,出具权威、专业的事故调查报告。报告中包含有大量关于事故的隐患信息和整改措施建议信息。本文以2012年到目前为止,各省市煤矿安全监督局公布的44份重大煤矿事故调查报告为数据来源,对其进行挖掘分析。首先简介了狄利克雷模型,并说明其与传统文本挖掘方法区别,接着对挖掘过程进行阐述:数据清洗、分词、过滤停止词、建立“文档—词语”矩阵。并对事故报告的基本信息通过提取高频词汇和逆文档概率的关键词进行描述,进行可视化展示;对事故报告的隐藏信息,采用狄利克雷主题模型进行主题挖掘,发现事故调查报告中大致包含有隐患主题、处罚主题以及整改措施主题三个主题内容。经过机器学习后得到的隐患主题,通过主题强度比较,最终分析得到关于作业人员与安全管理方面的隐患,在事故中占据更大比例,需要作业人员、管理人员和监管人员特别注意,在排除隐患时,应该优先解决作业人员的不安全行为和完善企业自身管理;对于处罚主题,在调查报告中,对相关责任人员的处罚...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状
        1.2.1 事故调查报告的研究现状
        1.2.2 主题模型研究现状
        1.2.3 研究评述
    1.3 研究内容与方法
        1.3.1 研究内容
        1.3.2 研究方法
        1.3.3 技术路线
第2章 相关概念与理论基础
    2.1 事故调查与事故调查报告
        2.1.1 事故调查
        2.1.2 事故调查报告
    2.2 LDA主题模型
        2.2.1 模型简介
        2.2.2 狄利克雷分布
        2.2.3 模型算法
    2.3 TF-IDF与特征词
第3章 事故调查报告的数据预处理
    3.1 处理平台
    3.2 数据分词处理
        3.2.1 利用基础词典分词
        3.2.2 扩充个人用户词典
        3.2.3 过滤停止词
    3.3 数据语料库处理
        3.3.1 分词文件汇集为语料库
        3.3.2 转化DTM矩阵
第4章 事故调查报告的LDA模型求解
    4.1 词频及TF-IDF分析
        4.1.1 词频提取关键词
        4.1.2 TF-IDF提取特征词
    4.2 确定参数
        4.2.1 确定超参数α和β
        4.2.2 确定主题个数K
    4.3 模型求解
第5章 事故调查报告的LDA主题分析
    5.1 隐患主题分析
        5.1.1 确定隐患主题个数
        5.1.2 结果解释
        5.1.3 使用LDAvis进行可视化展示
    5.2 处理意见主题分析
    5.3 防范措施主题分析
总结与展望
致谢
参考文献
附录



本文编号:3904542

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/kuangye/3904542.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户96ea1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com