基于决策树算法的研究及其在煤层底板突水中的应用
发布时间:2017-05-14 05:08
本文关键词:基于决策树算法的研究及其在煤层底板突水中的应用,由笔耕文化传播整理发布。
【摘要】:在我国,水害事故频繁发生,严重威胁人们的生命财产安全。而煤层底板突水现象是事故中最常见的一种,它是由多种因素综合作用的结果,情况复杂,以往的预测方法很难解决此问题。本文将煤层底板突水预测问题归纳为数据挖掘分类问题,引入决策树分类算法。 决策树算法是一种简单、易懂、有效的分类方法,已经在各行各业得到了广泛的应用。尽管目前的决策树算法发展的已经较为成熟,但还有需要改进的地方:一方面,分类精度还需进一步提升;另一方面,不能很好的处理非平衡数据集。本文针对存在的问题,展开对决策树算法的研究,首先通过UCI数据集对基于优化算法建立的分类模型进行实验论证,最后将其应用于实际的煤层底板突水预测中。本文的主要创新点如下: (1)提出一种基于C4.5与CART算法建立混合节点分裂算法的分类模型。对比研究几种常见的决策树算法之间的差异及内在联系,设计一种基于C4.5与CART算法建立混合节点分裂算法的分类模型,实验结果表明,改进的分类模型的分类精度较传统的C4.5与CART算法建立的分类模型有一定程度的提高,但是幅度不大。 (2)提出一种基于根节点信息的多决策树分类模型。为了更大程度的提高分类预测模型的分类精度,鉴于根节点的属性选择对于构建整个决策树的重要性,本文将每个分裂属性分别作为根节点建立n(分裂属性的个数)棵决策树,形成一种多决策树的分类器。利用UCI数据集进行分类器性能测试,实验表明,其分类精度较单棵决策树有很大的提升。 (3)设计了一种基于代价敏感的决策树算法分类模型。在实际应用中少数类的误判往往会带来巨大的代价,传统决策树对非平衡数据进行分类时往往出现少数类分类困难的问题。为了减少由于数据的不平衡性带来的少数类分类误差,本文引入代价敏感理论。在进行构建决策树时,将误分类代价引入节点分裂函数中,建立综合考虑属性信息和误分类代价的代价敏感决策树,并利用不同评价指标对其进行性能评价。实验结果表明,其在保证整体分类精度和多数类分类精度较高的基础上,大大提高了少数类的分类精度,从而获得具有性能较好的决策树分类预测模型。 (4)将基于代价敏感决策树算法应用于煤层底板突水预测中。本文分别采用经典的C4.5与CART算法建立突水预测模型,与基于代价敏感建立的模型进行实验,对比三种算法的准确率、真实正类率、真实负类率、G-mean值、F-measure值。实验结果表明,基于代价敏感的决策树算法与传统的决策树算法相比,有很大的优势,这对实际的煤矿防治水有很大的意义。
【关键词】:决策树 混合分裂 根节点 代价敏感 突水预测
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TD745
【目录】:
- 摘要3-5
- ABSTRACT5-11
- 第一章 绪论11-17
- 1.1 研究背景和意义11-12
- 1.2 相关研究综述12-15
- 1.2.1 决策树分类算法研究综述12-13
- 1.2.2 煤层底板突水预测问题研究综述13-15
- 1.3 本文研究的主要内容15-16
- 1.4 本章小结16-17
- 第二章 决策树分类模型的理论基础17-31
- 2.1 决策树算法17-21
- 2.1.1 基本概念17-19
- 2.1.2 建树过程19
- 2.1.3 规则提取19-20
- 2.1.4 剪枝技术20-21
- 2.2 常见的决策树算法21-28
- 2.2.1 ID3算法21-24
- 2.2.2 C4.5算法24-26
- 2.2.3 CART算法26-28
- 2.3 决策树算法存在的问题28-30
- 2.3.1 决策树算法的分类精度28-29
- 2.3.2 决策树算法的非平衡数据集处理能力29-30
- 2.4 本章小结30-31
- 第三章 基于改进的决策树分类算法研究31-47
- 3.1 三种节点分裂算法比较31-36
- 3.1.1 基于三种算法的节点分裂指标值对比及分析31-33
- 3.1.2 基于三种节点分裂算法的决策树分类性能比较33-36
- 3.2 基于节点分裂混合算法的决策树分类器36-40
- 3.2.1 节点混合算法的算法描述36-37
- 3.2.2 节点混合算法的程序流程37-38
- 3.2.3 混合算法的分类性能实证分析38-40
- 3.3 基于根节点信息的多决策树分类器40-45
- 3.3.1 算法流程设计40-42
- 3.3.2 多决策树算法与基于混合算法的单决策树算法的比较42-45
- 3.4 本章小结45-47
- 第四章 基于代价敏感的决策树分类模型47-65
- 4.1 非平衡数据简介47
- 4.2 非平衡数据集分类困难原因分析47-49
- 4.2.1 数据稀少问题47-48
- 4.2.2 数据碎片问题48
- 4.2.3 噪声数据存在的问题48-49
- 4.2.4 评价指标选择问题49
- 4.3 非平衡数据集分类问题的解决方法49-50
- 4.3.1 改变数据分布方法49-50
- 4.3.2 改进分类算法50
- 4.4 代价敏感学习50-56
- 4.4.1 代价敏感决策树学习的研究51
- 4.4.2 代价敏感学习的理论基础51-52
- 4.4.3 基于代价敏感的分裂属性选择52-54
- 4.4.4 评价指标54-56
- 4.5 基于代价敏感的决策树算法56-57
- 4.6 基于代价敏感决策树算法性能实证分析57-63
- 4.6.1 数据集简介57
- 4.6.2 实验设置57-58
- 4.6.3 实验结果及分析58-63
- 4.7 本章小结63-65
- 第五章 优化后的决策树算法在煤层底板突水预测中的应用65-75
- 5.1 突水因素分析65-68
- 5.2 数据采集与描述68-69
- 5.2.1 数据采集68-69
- 5.2.2 数据分析69
- 5.3 基于代价敏感决策树的煤层底板突水预测模型69-71
- 5.4 实验结果分析71-74
- 5.5 本章小结74-75
- 第六章 总结与展望75-77
- 6.1 总结75-76
- 6.2 展望76
- 6.3 本章小结76-77
- 参考文献77-81
- 致谢及资助81-83
- 攻读硕士期间发表的论文83
【参考文献】
中国期刊全文数据库 前10条
1 高阳;廖家平;吴伟;;基于决策树的ID3算法与C4.5算法[J];湖北工业大学学报;2011年02期
2 高嘉伟;梁吉业;;非平衡数据集分类问题研究进展[J];计算机科学;2008年04期
3 史岩;李小民;齐晓慧;;一种新型欠采样的支持向量机非平衡数据故障诊断研究[J];计算机测量与控制;2012年05期
4 John Durkin,蔡竞峰,蔡自兴;决策树技术及其当前研究方向[J];控制工程;2005年01期
5 余永洋,李忠凯;用模糊聚类分析方法评价10煤底板突水危险性[J];煤炭技术;2004年09期
6 陈辉林;夏道勋;;基于CART决策树数据挖掘算法的应用研究[J];煤炭技术;2011年10期
7 许延春;耿德庸;;井壁破坏的模糊聚类分析和预测[J];煤炭科学技术;1992年07期
8 刘伟韬,张文泉,李加祥;用层次分析-模糊评判进行底板突水安全性评价[J];煤炭学报;2000年03期
9 曹庆奎;赵斐;;基于模糊-支持向量机的煤层底板突水危险性评价[J];煤炭学报;2011年04期
10 肖建于;童敏明;姜春露;;基于模糊证据理论的煤层底板突水量预测[J];煤炭学报;2012年S1期
本文关键词:基于决策树算法的研究及其在煤层底板突水中的应用,由笔耕文化传播整理发布。
,本文编号:364331
本文链接:https://www.wllwen.com/kejilunwen/anquangongcheng/364331.html