基于随机森林模型的岩爆等级预测研究
发布时间:2019-11-22 02:09
【摘要】:以岩石单轴抗压强度、单轴抗拉强度、硐室最大切向应力、岩石压拉比、应力系数、弹性变形指数和完整性系数为岩爆评价指标,建立了4种评价方案;在引入随机森林算法的基础上,建立了岩爆等级预测的随机森林模型,并通过R语言编写代码对该模型进行了计算,得出评价指标的重要性和预测结果;将4种评价方案用随机森林法、线性回归法和支持向量机法分别进行预测并将结果进行对比分析。结果表明:随机森林法的岩爆预测准确率较高(达到97%),适用于解决数据不完全的小样本问题;岩石完整性系数重要度最大,岩石单轴抗压强重要度最小。
【图文】:
并行处理、运算效率高、训练速度快、对异常值和噪声容忍度好、预测准确率高、可对变量重要性进行排序和不容易出现过拟合等优点在岩土工程[11]、水电系统[12]、金融证券[13]、生态学[14]等方面取得了广泛的应用。2岩爆等级预测模型的构建2.1模型构建流程随机森林分类是由很多决策树分类模型{h(X,Θm),m=1,…,n}组成的分类模型的集合,参数集{Θm}是独立同分布的随机向量,在给定自变量X下,每个决策树分类模型都有一票投票权来选择最优的分类结果。岩爆等级预测的随机森林模型构建流程见图1。图1岩爆等级判别的随机森林模型构建流程模型构建步骤[12,15]如下:1)从给定的n个岩爆样本中随机有放回的抽出m个样本,每棵分类树的全部训练数据形成一个训练样本集。2)每个训练样本集单独生长成为一棵不剪枝叶的分类树。在树的每个节点处从K个特征中随机挑选k个特征(k≤K),在每个节点上从k个特征中选取最优特征进行分支生长。这棵分类树充分生长,使每个节点的不纯度达到最小,不进行剪枝操作。3)根据步骤2),按生成的多个树分类器对岩爆测试样本进行预测。对m个岩爆样本分别建立m个岩爆决策树模型,对测试样本的分类进行决策,总共得到m个分类结果,岩爆测试样本的预测结果按每个树分类器的投票多少而决定。2.2模型的实现岩爆等级预测的随机森林模型的实现需借助相关的数据处理工具。R[12]是一种自由软件编程语言与操作环境,是一种数学计算的环境,是一套完整的数据处理、计算和制图软件系统,具备高效的数据处理和存储功能。本文利用R语言,通过调用随机森林算法程序包,编写数据处理计算的R语言代码,进而实现岩爆预测随机森林模型计算。其具体计算流程如图2所示。图2随机森?
6奙个岩爆样本分别建立m个岩爆决策树模型,,对测试样本的分类进行决策,总共得到m个分类结果,岩爆测试样本的预测结果按每个树分类器的投票多少而决定。2.2模型的实现岩爆等级预测的随机森林模型的实现需借助相关的数据处理工具。R[12]是一种自由软件编程语言与操作环境,是一种数学计算的环境,是一套完整的数据处理、计算和制图软件系统,具备高效的数据处理和存储功能。本文利用R语言,通过调用随机森林算法程序包,编写数据处理计算的R语言代码,进而实现岩爆预测随机森林模型计算。其具体计算流程如图2所示。图2随机森林模型计算流程需要注意的是,为了便于数据的调用和后续计算,数据集应按照R的格式要求保存成csv格式,再进行导入。随机森林主要参数有岩爆预测中输入变量的数量(mtry)及选择森林中树的数量(ntree),这2个参数决定计算的效率和结果的准确性,出于对样本的数量和计算结果的准确性考虑,本文将mtry和ntree分别设置为3和500。R本身不具备对随机森林模型的处理功能,要实现岩爆预测随机森林模型的计算,需要对相关过程进行R语言编程。在开源的R语言环境下,本文编写了软件包调用、数据导入、数据计算以及结果输出的代码,具体如下:>install.packages("randomForest")>library(randomForest)24矿冶工程第37卷
本文编号:2564275
【图文】:
并行处理、运算效率高、训练速度快、对异常值和噪声容忍度好、预测准确率高、可对变量重要性进行排序和不容易出现过拟合等优点在岩土工程[11]、水电系统[12]、金融证券[13]、生态学[14]等方面取得了广泛的应用。2岩爆等级预测模型的构建2.1模型构建流程随机森林分类是由很多决策树分类模型{h(X,Θm),m=1,…,n}组成的分类模型的集合,参数集{Θm}是独立同分布的随机向量,在给定自变量X下,每个决策树分类模型都有一票投票权来选择最优的分类结果。岩爆等级预测的随机森林模型构建流程见图1。图1岩爆等级判别的随机森林模型构建流程模型构建步骤[12,15]如下:1)从给定的n个岩爆样本中随机有放回的抽出m个样本,每棵分类树的全部训练数据形成一个训练样本集。2)每个训练样本集单独生长成为一棵不剪枝叶的分类树。在树的每个节点处从K个特征中随机挑选k个特征(k≤K),在每个节点上从k个特征中选取最优特征进行分支生长。这棵分类树充分生长,使每个节点的不纯度达到最小,不进行剪枝操作。3)根据步骤2),按生成的多个树分类器对岩爆测试样本进行预测。对m个岩爆样本分别建立m个岩爆决策树模型,对测试样本的分类进行决策,总共得到m个分类结果,岩爆测试样本的预测结果按每个树分类器的投票多少而决定。2.2模型的实现岩爆等级预测的随机森林模型的实现需借助相关的数据处理工具。R[12]是一种自由软件编程语言与操作环境,是一种数学计算的环境,是一套完整的数据处理、计算和制图软件系统,具备高效的数据处理和存储功能。本文利用R语言,通过调用随机森林算法程序包,编写数据处理计算的R语言代码,进而实现岩爆预测随机森林模型计算。其具体计算流程如图2所示。图2随机森?
6奙个岩爆样本分别建立m个岩爆决策树模型,,对测试样本的分类进行决策,总共得到m个分类结果,岩爆测试样本的预测结果按每个树分类器的投票多少而决定。2.2模型的实现岩爆等级预测的随机森林模型的实现需借助相关的数据处理工具。R[12]是一种自由软件编程语言与操作环境,是一种数学计算的环境,是一套完整的数据处理、计算和制图软件系统,具备高效的数据处理和存储功能。本文利用R语言,通过调用随机森林算法程序包,编写数据处理计算的R语言代码,进而实现岩爆预测随机森林模型计算。其具体计算流程如图2所示。图2随机森林模型计算流程需要注意的是,为了便于数据的调用和后续计算,数据集应按照R的格式要求保存成csv格式,再进行导入。随机森林主要参数有岩爆预测中输入变量的数量(mtry)及选择森林中树的数量(ntree),这2个参数决定计算的效率和结果的准确性,出于对样本的数量和计算结果的准确性考虑,本文将mtry和ntree分别设置为3和500。R本身不具备对随机森林模型的处理功能,要实现岩爆预测随机森林模型的计算,需要对相关过程进行R语言编程。在开源的R语言环境下,本文编写了软件包调用、数据导入、数据计算以及结果输出的代码,具体如下:>install.packages("randomForest")>library(randomForest)24矿冶工程第37卷
【相似文献】
相关期刊论文 前1条
1 温廷新;张波;邵良杉;;煤与瓦斯突出预测的随机森林模型[J];计算机工程与应用;2014年10期
本文编号:2564275
本文链接:https://www.wllwen.com/kejilunwen/kuangye/2564275.html