基于梯度提升决策树与支持向量机融合模型的成矿预测研究
发布时间:2024-05-10 20:58
在成矿预测领域,地质资料种类丰富,数据量大,机器学习算法的优势得以体现,机器学习算法成矿预测逐渐辅助甚至替代了传统的找矿方式。但由于数据问题或各算法自身的局限性,单一算法在实际应用时各有利弊。如何弥补数据或算法的缺陷,更好地发挥机器学习的优势,值得研究与探索。因此,本文对机器学习中的经典算法支持向量机(SVM)在成矿预测领域的应用模型进行了改进,利用新疆东天山研究区的地球化学数据、构造数据、地层及岩体数据,通过构建梯度提升决策树(GBDT)与支持向量机(SVM)的融合模型,对新疆东天山地区进行了成矿预测。论文主要研究内容及成果如下:(1)研究区控矿要素的梳理及数据处理。系统的收集了研究区资料,了解研究区成矿模式;从多元数据类型中初步确定控矿要素,并利用GIS技术进行控矿要素的数据处理,构建机器学习模型训练数据集。(2)特征组合的构建。成矿预测领域特征的选取及处理大多基于专家经验,有较大的不确定性。因此本文在传统特征选取的基础上提出了GBDT-SVM模型,首先使用梯度提升决策树(GBDT)算法构建特征组合,再将特征组合作为新的特征,用于支持向量机(SVM)分类模型的构建,弥补了支持向量机...
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
本文编号:3969008
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
图1-1基于GBDT-SVM模型的成矿预测流程图
1绪论8图1-1基于GBDT-SVM模型的成矿预测流程图1.5本文创新点目前SVM算法在成矿预测领域的有效性已经得到了广泛的证实,但是在应用过程中的特征选择与参数寻优环节仍然存在不足:特征的选取及处理常基于专家经验,具有较大的不确定性;参数寻优算法的精确度有限,影响了模型的推广能....
图2-1样本学习模型
2支持向量机经典模型10图2-1样本学习模型公式2-1中(,)称为学习函数集或预测函数集,w为函数的参数,,(,)为在给定的输入数据x下,输出值y与学习器给出的准确值(,)之间误差值的数学期望。显而易见的是模型的学习能力与损失函数值成反比,损失值(误差值)越小,表示模型的学习能力....
图2-2欠拟合(左)与过拟合(右)示意图
2支持向量机经典模型12图2-2欠拟合(左)与过拟合(右)示意图2.1.2VC维与结构风险最小化原则支持向量机的VC维是定义函数集学习性能的指标,用于指示机器训练过程中的收敛速度和模型的推广性能。VC维定义如下:如果指示函数集中有h个样本,并且这些样本可以以2种形式打散,则函数集....
图2-2线性支持向量机(林楠,2015)
2支持向量机经典模型14图2-2线性支持向量机(林楠,2015)图中,方点代表正类样本(标签为+1),圆点代表负类样本(标签为-1),穿过样本点,将其划分为两类的粗实线为分类界线,与分类界线呈平行对称分布,且穿过部分样本点的两条虚线之间的距离为分类间隔。分类间隔越大,算法所学习到....
本文编号:3969008
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3969008.html