当前位置:主页 > 科技论文 > 电子信息论文 >

基于模型集群分析的近红外光谱变量选择方法研究

发布时间:2020-07-22 09:28
【摘要】:近红外光谱检测是一种快速高效的检测技术,近些年在各个领域都有着广泛的应用,在农业产品的品质分析领域也发挥着越来越重要的作用。但在近红外光谱建模分析中存在一个很重要的问题,就是光谱中含有大量的冗余信息,并且组分特征吸收区域不明确。变量选择可以提高模型质量,而本文主要研究的是基于模型集群分析(MPA)的变量选择方法。因为现有的变量选择方法大多基于一次建模思想,收集的样本数不足以表达总体信息,容易导致模型不标准或者过拟合。所以MPA最大限度的利用已有的样本,通过随机采集实现对样本的最大信息获取。自助式空间柔性收缩法(BOSS)和蒙特卡洛变量组合集群分析法(MC-VCPA)都是结合了MPA的近红外光谱变量选择方法。BOSS结合软收缩策略和加权引导抽样(WBS)方法,并提供了一种从模型回归系数(RC)中提取信息的方法。MC-VCPA通过蒙特卡洛采样(MCS)方法对样本空间进行随机采样,并结合VCPA对不同样本子集的变量空间进行特征变量选取。本文运用这两种基于MPA的变量选择方法,通过偏最小二乘(PLS)建立预测模型,并对预测集样本进行预测。对比UVE和GA等变量选择算法,BOSS对啤酒中酵母浓度的预测,相比全光谱PLS模型的预测均方根误差(RMSEP)值由0.5348下降到0.1565,其预测精度提高了70%。MC-VCPA对小麦蛋白质含量的预测相比全光谱PLS模型的RMSEP由0.5096下降到0.3295,预测精度提高了35%。结果表明BOSS和MC-VCPA对近红外光谱数据分析进行定量分析都显著的提高了模型的预测精度。
【学位授予单位】:长春理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN21
【图文】:

近红外光谱,啤酒


中K 为子模型的数量,ikb,为在模型中变量i的归一化回归系数的绝对值四步,根据变量的新权重来生成新的子集。与 BSS 相似,提取并使用唯建子模型。在 WBS 中替换的数量是由前一步中变量的平均数量决定的。中的变量数量大约是之前的 0.632 倍。这一步确保在最好的子模型中具有数绝对值的变量有更大的可能性被选择到子模型中。复第二步到第四步,直到新子集的变量数等于 1。在迭代过程中使用 RM集被选为最优变量集。验数据及光谱预处理 实验数据章选用的啤酒近红外光谱数据包含 60 个样本[42],其中每个样本的近红外在 1100nm~2250nm。其光谱的间隔为 2nm,运用 Kennard-Stone(K-S)两组近红外光谱数据和化学值,分别为 40 个和 20 个样本。作为校正集母浓度的预测模型和预测集检验模型,啤酒的近红外光谱如图 3.3 所示。

近红外光谱,小麦蛋白质,样本,特征变量


图 4.3 小麦的近红外光谱图章研究所用的93个小麦样本和小麦蛋白质化学值数据来源于国家粮食研究中心,本次研究所用的分类方法为 Kennard-Stone(K-S)算法。 93 个小麦样本分为两个样本集,分别为包含 61 个样本的建模集样本和的预测集样本,小麦蛋白质含量统计如表 4-2 所示。表 4-2 小麦的蛋白质含量统计表样本数 最大值 最小值 平均值 标准集 61 17.07 12.58 14.41 0.9集 32 16.04 12.37 14.48 0.9特征变量选择C-VCPA 首先通过 MCS 方法随机从校正集小麦样本空间获取 50 个样对每个样本子集运用 VCPA 方法选取出其子集的特征变量,其次统计

变量子集,子集,样本,变量


每个样本子集运用 VCPA 的 BMS 对这个子集的变量进行 1000 次采保证每个变量具有相同的被采样概率,而且还能获取1000组不同的变S 分别计算出这 1000 组变量子集的 RMSEC,保留 RMSEC 最小的前作为优秀变量子集如图 4.4 所示。计算出这 100 个优秀变量子集中每,并通 EDF 删除出现频率小的变量,将保留的变量继续进行 1000 次F 删除,此过程重复 50 次,最终保留 14 个光谱变量,计算最终保留变量组合的 RMSEC,得到值最小的变量组合则为样本子集中最优秀

【相似文献】

相关期刊论文 前10条

1 牟建波;刘峧;;基于惩罚方法的贝叶斯群组变量选择[J];绵阳师范学院学报;2017年02期

2 戴伯新;;回归变量选择中的数据诊断[J];应用概率统计;1992年04期

3 王银辉;徐文科;;基于风险函数评价自变量选择对预测的影响[J];哈尔滨师范大学自然科学学报;2012年01期

4 李太福;易军;苏盈盈;胡文金;余春娇;;基于特征子空间虚假邻点判别的软传感器模型变量选择[J];机械工程学报;2011年12期

5 张庆;李云霞;;函数型变量选择法用于空气质量影响因素实证分析[J];安庆师范大学学报(自然科学版);2017年04期

6 李扬;许文甫;马双鸽;;污染数据的稳健稀疏成组变量选择方法研究[J];统计与信息论坛;2018年06期

7 徐安察;王玮明;;应用统计类专业探究性教学模式探索与实践——以变量选择准则为例[J];赤峰学院学报(自然科学版);2014年19期

8 杨红;陈德棉;;个人住房抵押贷款违约相关变量选择[J];现代管理科学;2009年04期

9 钟先乐;樊亚莉;张探探;;基于t函数的稳健变量选择方法[J];上海理工大学学报;2017年06期

10 严奇琪;王延新;;高维部分线性小波模型中的变量选择[J];宁波工程学院学报;2018年02期

相关会议论文 前10条

1 张俊华;方伟武;;调查表分析中变量选择的一些方法(英文)[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年

2 李慷;席裕庚;;复杂过程系统中操作变量选择与定位的方法研究[A];1993年控制理论及其应用年会论文集[C];1993年

3 罗荣富;邵惠鹤;;推断控制中二次变量选择方法的研究[A];1992年中国控制与决策学术年会论文集[C];1992年

4 徐登;范伟;梁逸曾;;紫外光谱结合变量选择和偏最小二乘回归同时测定水中重金属镉、锌、钴[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

5 曹磊;丛培盛;;偏相关系数矩阵方法用于烟草质量控制的变量选择[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年

6 梁逸曾;李洪东;许青松;曹东升;张志敏;;灰色化学建模与模型集群分析——兼论过拟合、稳健估计、变量选择与模型评价[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

7 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

8 刘咸姝;潘日芳;;满意控制结构综合的专家系统[A];1996年中国智能自动化学术会议论文集(上册)[C];1996年

9 范伟;李洪东;梁逸曾;;近红外光谱结合CARS变量选择方法用于食醋中总酸的测定[A];中国化学会第28届学术年会第9分会场摘要集[C];2012年

10 张俊华;;南水北调一中线调水区域内降水的时空变化规律的分析研究[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年

相关博士学位论文 前10条

1 王延新;高维模型的变量选择与稀疏正则化[D];武汉大学;2013年

2 李子林;高维基因数据中的统计方法[D];清华大学;2016年

3 唐凯临;变量选择和变换的新方法研究[D];同济大学;2008年

4 秦志敏;我国上市公司财务预警变量选择研究[D];东北财经大学;2012年

5 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年

6 姬永刚;分位数回归中的贝叶斯变量选择[D];东北师范大学;2012年

7 赵军;Expectile回归和最优资产组合中的变量选择问题[D];浙江大学;2017年

8 苏盈盈;基于核方法的非线性系统变量选择及其应用[D];重庆大学;2014年

9 王歆e

本文编号:2765631


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2765631.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fb78c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com