当前位置:主页 > 科技论文 > 化学论文 >

基于光谱信息的复杂样品集成建模方法研究

发布时间:2018-03-29 19:37

  本文选题:复杂样品 切入点:定量分析 出处:《天津工业大学》2017年硕士论文


【摘要】:光谱分析因其具有快速、无损、操作简单、易于在线等优势已广泛应用于石油、烟草、药品、食品等复杂样品的分析检测。但是,复杂样品光谱存在谱带重叠、背景和噪声干扰严重等问题,需要借助化学计量才可以进行定性定量分析。建立对未知样品准确预测的模型是光谱分析技术的关键。传统多元校正通过单一建模方法在光谱和待测目标值之间建立定量模型,预测效果往往不够令人满意。集成建模方法通过一定的方式产生多个训练子集,再采用一定的基础建模方法建立多个子模型,最后将多个子模型结果集成得到最终预测结果,可以得到更高的预测准确度和稳定性。其中训练子集的产生方式、建模方法以及子模型的集成方式是多模型建模的三个主要方面。本论文围绕多模型建模的三个方面进行研究,提出了三种新型建模方法,并应用于复杂样品光谱定量分析,具体内容如下:1.在基础建模方面,引入了极限学习机(extreme learning machine,ELM)建模方法,并验证了其在复杂样品定量分析中的可行性。传统的建模方法主要分为线性和非线性两类,线性方法具有效率高和参数少的优点,但是遇到非线性问题时效果较差;非线性方法在处理非线性问题时具有独特的优势,但也存在参数多、易于陷入局部最优和费时等缺点。因此,本论文引入了 ELM,该算法结合了线性建模方法和非线性建模方法的优势。首先研究了 ELM的效率和稳定性;其次,定义了一个新参数来确定最佳激励函数和隐含层节点数。采用三组光谱数据验证该方法的有效性,并与主成分回归(principle component regression,PCR)、偏最小二乘回归(partial least squares,PLS)、支持向量回归(Support Vector Regression,SVR)和前馈人工神经网络(back propagation-artificial neural network,BP-ANN)在预测准确性和稳定性方面进行比较。结果表明,对于一个给定的数据集,ELM的效率主要受节点数的影响。尽管ELM模型存在不稳定性,但是在接近最佳参数时ELM却趋于稳定。与其它几种方法相比,ELM具有更好或者相当的性能。该方法具有预测准确度高、速度快的优势。2.在训练子集的选择方面,提出了一种通过推进策略(boosting)从变量方向建立子模型的集成建模方法,命名为变量空间推进偏最小二乘(variable space boosting partial least squares,VS-BPLS)。该方法通过多次循环建立多个变量空间PLS子模型。在第一次循环中,训练集中所有变量赋予相同的取样权重,根据取样权重从中选取一定数目的变量建立PLS子模型。在后续循环中,训练误差大的变量赋予更大的权重。将所有子模型预测结果的加权平均作为最终预测结果。采用两组小样品的光谱数据验证该方法的有效性,并与传统PLS、蒙特卡罗无信息变量消除 PLS(Monte Carlo uninformative variable-elimination PLS,MCUVE-PLS)和随机检验 PLS(randomization test-PLS,RT-PLS)方法进行比较。结果表明,VS-BPLS的预测准确度和稳定性优于其它三种方法。该方法从变量方向选择部分变量建立子模型,不仅可以解决小样品的问题,而且可以删除变量中的冗余信息。3.在子模型集成方面,将展开策略引入到子模型的集成中,并引入经验模态分解从频率方向产生多个子模型,提出了一种高低频展开的偏最小二乘回归(high and low frequency unfolded PLSR,HLUPLSR)方法。首先通过 EMD 将原始信号分解为有限数目的固有模态函数(intrinsic mode function,IMF)和一个残差。其次,将前面高频的IMFs合并为高频矩阵,剩余的IMFs和残差合并为低频矩阵。最后,将两矩阵在变量方向展开构,构成一个扩展矩阵,并在扩展矩阵和目标值之间建立PLS模型。将该方法应用到燃油中芳烃含量的测定。与传统PLS、1st-PLS和CWT-PLS相比,HLUPLSR方法在预测准确度方面具有明显的优势。该方法结合了经验模态分解(empirical mode decomposition,EMD)、展开策略和PLS的优势。该方法不仅充分利用了光谱信号的局部特征信息,而且避免了子模型权重的选择。
[Abstract]:This paper introduces three new modeling methods , such as linear and non - linear , which has the advantages of high efficiency and low parameter . The results show that the efficiency of ELM is mainly influenced by the number of nodes for a given set of data . The results show that ELM is more stable than other methods . In the first cycle , all the variables in the training set are given the same sampling weights , and the PLS sub - model is established by selecting a certain number of variables according to the sampling weights .

【学位授予单位】:天津工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O657.3

【参考文献】

相关期刊论文 前1条

1 郝勇;孙旭东;蔡丽君;刘燕德;;基于互信息方法的燃油品质光谱分析模型构建与简化[J];光谱学与光谱分析;2012年01期



本文编号:1682555

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/huaxue/1682555.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0f878***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com