基于集成学习的激光诱导击穿光谱学技术定量分析算法及应用研究
发布时间:2021-07-27 21:42
激光诱导击穿光谱学技术(Laser-Induced Breakdown Spectroscopy,LIBS)是一项新的化学分析技术,由于其多种优点目前被广泛应用于材料识别以及混合物定量和定性分析中。其中,LIBS定量分析方法的研究是当前的研究热点,可以便捷地帮助科研工作者确定混合物中的元素组成以及元素含量。因此对LIBS定量分析技术进行深入研究并提升其分析预测精度,具有重要的实际应用价值。论文综述了LIBS定量分析领域的研究工作进展,介绍了基于神经网络、基于支持向量回归、基于随机森林回归的LIBS定量分析方法,并分析了各种方法的优缺点以及应用范围。针对单一学习器容易受到基体效应的影响、容易出现过拟合的风险、容易被随机产生的误差影响而影响预测精度的问题,为了进一步提升LIBS定量分析方法的预测精度,并克服单一学习器的不足之处,本文提出了一种两层结构的基于集成学习的LIBS定量分析方法。该方法首先由基学习器选择的流程选择出合适的基学习器。第一层由若干个选择的基学习器组成。将第一层的基学习器交叉验证的过程中对验证集的预测作为次级元学习器的输入特征,并以此进行元学习器的训练,并将最终训练完成的...
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
常见LIBS分析实验装置
。Bagging技术是学习结果集成的经典例子。当给定一个训练集,它首先会通过对整个训练集进行Bootstrap的随机抽样、随机子空间、扰动、投影等方式来获得若干个子抽样训练集。且训练子集抽样之间尽可能保持相对独立。这样,我们可以获得数据集在相对独立和稳定的情况下的抽样。然后对于这若干个训练集使用不同的基学习器进行训练和学习,再对于分类任务使用投票的方式、对于回归任务使用算术平均或者加权平均的方式来形成组合的强学习器。最终再使用这些组合学习器对测试集中的样本进行预测,以获取这些测试集的对应测试结果。图2-1Bagging的常见流程结构2.1.2Boosting集成框架概述Boosting是一种可以用于提升弱学习器的泛化能力的有监督学习的集成算法。它最开始由MichaelKearns[3]提出。其主要的思想是将弱学习器组装成强学习器。在PAC学习框架中,一定可以使用某种方法将弱分类器组装成一个强分类器。大多数的Boosting算法由一系列的弱学习器组成,使用迭代的方法,根据他们在分类中的准确率或者回归预测中的误差情况给予弱学习器不同的权重,同时会对使用的数据集进行重新加权,以此来强化对此前分类错误或者预测误差较大的数据的重新分类和预测。Adaboost[4]算法是学习过程集成的典型例子。在AdaBoost的训练中,算法会通过不断动态调整训练集中不同样本的对应信心值(权值)来体现学习器当前对样本的预测精度,最终将动态形成的多个弱学习器组合成强学习器。当给定一个原始的训练集时,首先Adaboost会赋予训练集的每个样本相等的权重系数,此时说明训练集中的每个样本的重要程度相等。接着使用这些样本训练一个弱分类器,并对原始训练集的样本进行预测。根据预测情况更新样本的权重值,提高预测正确的样本的权重,并降低预测错误的样本的权重。?
华南理工大学硕士学位论文8一个强学习器。2.1.3Stacking集成框架概述Stacking[5]方法是指在组合集成多个基学习器时使用一个二级元学习器来综合权衡各个基学习器的输出。首先训练多个不同的基学习器,然后把不同的基学习器交叉验证训练过程中对于验证集的预测作为二级元学习器的输入进行再次训练,以得到一个最终的输出。理论上,Stacking可以表示上面提到的两种集成学习方法,只要采用合适的模型组合策略即可。一般来说,会使用Stacking作为提升预测结果的方法。图2-2Stacking集成的常见流程Stacking方法的常见流程如图2-2所示。首先使用不同的基模型对整个的训练集的不同子抽样中进行训练和学习。注意与Bagging不同的是,在Stacking中的子抽样是不放回的子抽样。然后将这些基模型预测得到的输出作为第二层学习器的输入,这里常常称第二层学习器为元学习器。等待元学习器学习训练完毕我们便可以得到我们所需的最终模型。在对测试集进行测试的时候也需要使用相同的流程对测试集进行预训练,再交由元学习器比较学习效果。2.1.4集成学习的相关应用集成学习作为当前比较热门的研究方向,被广大学者应用于各种研究中,以提高单独学习器的预测性能和泛化能力。PouriyehS[6]等人比较了各类单独学习器在对心脏疾病的图像分类时的准确性。对比了包括决策树(DecisionTree)、朴素贝叶斯(NaiveBayes)、支持向量机(SupportVectorMachine)、K临近(K-NearestNeighbor)等各种学习算法的分类性能。同时分别使用Bagging、Boosting和Stacking三种不同的方式对各类基学习器进行集成,并通过实验发现使用Boosting的结构在其应用场景中可以显著地提升分类的准确性以及性能。HeH[7]等人则提出了一个三层的Stacking模型应用在用户信用评级中。该模型通过对XG
【参考文献】:
期刊论文
[1]基于LIBS技术的钢铁合金中Cr和Ni元素SVM定量分析方法研究[J]. 张莹,李颖,谷艳红,郭豪,黎娜. 光谱学与光谱分析. 2016(07)
硕士论文
[1]基于深度学习和集成学习的银行卡交易反欺诈技术研究[D]. 窦路路.东华大学 2018
本文编号:3306596
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
常见LIBS分析实验装置
。Bagging技术是学习结果集成的经典例子。当给定一个训练集,它首先会通过对整个训练集进行Bootstrap的随机抽样、随机子空间、扰动、投影等方式来获得若干个子抽样训练集。且训练子集抽样之间尽可能保持相对独立。这样,我们可以获得数据集在相对独立和稳定的情况下的抽样。然后对于这若干个训练集使用不同的基学习器进行训练和学习,再对于分类任务使用投票的方式、对于回归任务使用算术平均或者加权平均的方式来形成组合的强学习器。最终再使用这些组合学习器对测试集中的样本进行预测,以获取这些测试集的对应测试结果。图2-1Bagging的常见流程结构2.1.2Boosting集成框架概述Boosting是一种可以用于提升弱学习器的泛化能力的有监督学习的集成算法。它最开始由MichaelKearns[3]提出。其主要的思想是将弱学习器组装成强学习器。在PAC学习框架中,一定可以使用某种方法将弱分类器组装成一个强分类器。大多数的Boosting算法由一系列的弱学习器组成,使用迭代的方法,根据他们在分类中的准确率或者回归预测中的误差情况给予弱学习器不同的权重,同时会对使用的数据集进行重新加权,以此来强化对此前分类错误或者预测误差较大的数据的重新分类和预测。Adaboost[4]算法是学习过程集成的典型例子。在AdaBoost的训练中,算法会通过不断动态调整训练集中不同样本的对应信心值(权值)来体现学习器当前对样本的预测精度,最终将动态形成的多个弱学习器组合成强学习器。当给定一个原始的训练集时,首先Adaboost会赋予训练集的每个样本相等的权重系数,此时说明训练集中的每个样本的重要程度相等。接着使用这些样本训练一个弱分类器,并对原始训练集的样本进行预测。根据预测情况更新样本的权重值,提高预测正确的样本的权重,并降低预测错误的样本的权重。?
华南理工大学硕士学位论文8一个强学习器。2.1.3Stacking集成框架概述Stacking[5]方法是指在组合集成多个基学习器时使用一个二级元学习器来综合权衡各个基学习器的输出。首先训练多个不同的基学习器,然后把不同的基学习器交叉验证训练过程中对于验证集的预测作为二级元学习器的输入进行再次训练,以得到一个最终的输出。理论上,Stacking可以表示上面提到的两种集成学习方法,只要采用合适的模型组合策略即可。一般来说,会使用Stacking作为提升预测结果的方法。图2-2Stacking集成的常见流程Stacking方法的常见流程如图2-2所示。首先使用不同的基模型对整个的训练集的不同子抽样中进行训练和学习。注意与Bagging不同的是,在Stacking中的子抽样是不放回的子抽样。然后将这些基模型预测得到的输出作为第二层学习器的输入,这里常常称第二层学习器为元学习器。等待元学习器学习训练完毕我们便可以得到我们所需的最终模型。在对测试集进行测试的时候也需要使用相同的流程对测试集进行预训练,再交由元学习器比较学习效果。2.1.4集成学习的相关应用集成学习作为当前比较热门的研究方向,被广大学者应用于各种研究中,以提高单独学习器的预测性能和泛化能力。PouriyehS[6]等人比较了各类单独学习器在对心脏疾病的图像分类时的准确性。对比了包括决策树(DecisionTree)、朴素贝叶斯(NaiveBayes)、支持向量机(SupportVectorMachine)、K临近(K-NearestNeighbor)等各种学习算法的分类性能。同时分别使用Bagging、Boosting和Stacking三种不同的方式对各类基学习器进行集成,并通过实验发现使用Boosting的结构在其应用场景中可以显著地提升分类的准确性以及性能。HeH[7]等人则提出了一个三层的Stacking模型应用在用户信用评级中。该模型通过对XG
【参考文献】:
期刊论文
[1]基于LIBS技术的钢铁合金中Cr和Ni元素SVM定量分析方法研究[J]. 张莹,李颖,谷艳红,郭豪,黎娜. 光谱学与光谱分析. 2016(07)
硕士论文
[1]基于深度学习和集成学习的银行卡交易反欺诈技术研究[D]. 窦路路.东华大学 2018
本文编号:3306596
本文链接:https://www.wllwen.com/kejilunwen/huaxue/3306596.html
教材专著