当前位置:主页 > 科技论文 > 物理论文 >

基于近邻传播算法的波长选择方法

发布时间:2020-07-15 21:31
【摘要】:光谱分析能够通过样品的光谱和校正模型来快速预测样品的成分。校正模型预测性能的好坏,很大程度上取决于所选取的输入波长。为了降低模型复杂度,提升模型预测性能,有必要在建模前进行波长选择来减小数据维度,去除噪声和冗余数据。在各种波长选择方法中,多头绒泡菌网络(Physarum Polycephalum Network,PN)结合遗传偏最小二乘法(Genetic Algorithm-Partial Least Squares,GA-PLS)是一种新的并且有效的波长选择方法。但是该算法要求将整个光谱区间平均分成多个子波段区间,这种划分标准限制了变量选择能力和模型的预测性能。本文针对上述问题,提出了近邻传播(Affinity Propagation,AP)结合多头绒泡菌网络(PN)和遗传偏最小二乘法(GA-PLS)波长选择算法。其思想是将PN中的波段划分问题转化为聚类问题,通过使用AP自适应地调整分组数目及分组方式。然后采用PN进行变量的初次筛选得到候选波长,最后由GA-PLS对候选波长进行第二次选择得到特征变量。本文采用两个光谱数据库对提出的AP-PN-GA-PLS进行验证,并与全谱特征变量、区间偏最小二乘法(Interval Partial Least Squares,IPLS)、连续投影法(Successive Projections Algorithm,SPA)、GA-PLS、AP-GA-PLS、PN-GA-PLS等方法进行对比分析。结果表明在这七种波长选择算法中,AP-PN-GA-PLS在波长选择变量数最少的情况下能达到最好的模型预测性能。因此AP-PN-GA-PLS可以在不降低预测性能的情况下使模型的复杂度最低。
【学位授予单位】:西南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O433.4
【图文】:

食物源,管道,多头绒泡菌,节点


图 2.1 迷宫模型中,首先将食物源放置在充满琼脂的迷宫入口和出口1N 和2N ,然后让多头绒泡菌布满整个迷宫网络。多头,形成连接两个食物源的通道。部分管道内流通量内流通量减少,管道逐渐萎缩、消失。随着时间的增食物源的主要管道。最终,根据主管道流量大小的变食物源的最短管道[26]。实验中多头绒泡菌所表现出的行为,Tero 研究团队建6]。根据图 2.1(d),将食物源(1N )作为流量的流入点,点。从节点iN 到节点jN 的流量ijQ 可以表示为:4( )8ij i jijijr p pQL 节点iN 的压力值; 表示管道中流通物质的粘性,为jN 的管道半径;ijL 表示节点iN 到节点jN 的管道长iN 和节点jN 的管道不止一条的话,那么第一条管道

信息传递方式,吸引度,和式


图 3.1AP 网络中的信息传递方式吸引度 r (i , k )可由式(3.1)表示:'' '1( , ) ( , ) max{ ( , ) ( , )}t tk kr i k S i k a i k S i k ,1( , )tr i k 表示下一时刻的吸引度,'( , )ta i k 表示当前时刻的归属度,点i与点k 的相似度。归属度 a (i , k )可由式(3.2)和式(3.3)表示:''1{ , }( , ) min 0, ( , ) max{0, ( , )}t t ti i ka i k r k k r i k ,i k''1( , ) max{0, ( , )}t ti ka k k r i k ,1( , )ta i k 表示下一时刻的归属度,'( , )tr i k 表示当前时刻的吸引度。为了避免震荡,AP 算法更新信息时引入了阻尼系数 。每条信息被设置迭代更新值的 倍加上本次信息更新值的1 倍。则第 t 1次的1(tr , )i k的迭代值可以由式(3.4)和式(3.5)表示:1 1( , ) (1 ) ( , ) ( , )t t tr i k r i k r i k a i k a i k a i k

过程图,过程,聚类中心,吸引度


第三章 基于近邻传播的波长选择(2)根据先验知识确定偏好参考度kp 。若无先验知识,则kp 通常取所有数据点的平均相似度。用kp 的值代替相似度矩阵S 的对角线上的元素 S ( k , k )的值(3)AP 网络初始化。将吸引度信息 r (i , k )和归属度信息 a (i , k )设置为0,并设置迭代步数l和阻尼系数 。通常l设置为 1000, 设置为 0.9。(4)通过式(3.1)更新吸引度信息 r (i , k )。(5)通过式(3.2)和式(3.3)更新归属度信息 a (i , k )。(6)为避免震荡,采用式(3.4)和式(3.5)得到下一时刻的 r (i , k )和 a (i , k )。(7)终止条件。算法迭代次数达到l或在一定的迭代次数之内,聚类结果不发生明显变化,则迭代终止。(8)通过式(3.6)找到矩阵E 的对角线上的元素大于0 的下标组合C 作为聚类中心。然后比较剩余的每一个点与哪一个聚类中心点相似度最大,则将这点作为该聚类中心的类。E (i , k ) a (i , k ) r (i , k)(3.6)迭代过程如图 3.2 所示[27]。

【参考文献】

相关期刊论文 前5条

1 熊雅婷;李宗朋;王健;张英;冯斯雯;陈峰;宋全厚;;基于连续投影算法的黄酒成分检测模型[J];食品与发酵工业;2015年03期

2 邹小波;朱曾;赵杰文;;基于间隔偏最小二乘法的农产品近红外光谱谱区选择方法[J];现代科学仪器;2007年01期

3 褚小立;袁洪福;陆婉珍;;近年来我国近红外光谱分析技术的研究与应用进展[J];分析仪器;2006年02期

4 褚小立,袁洪福,王艳斌,陆婉珍;遗传算法用于偏最小二乘方法建模中的变量筛选[J];分析化学;2001年04期

5 袁洪福,陆婉珍;现代光谱分析中常用的化学计量学方法[J];现代科学仪器;1998年05期

相关会议论文 前1条

1 沈飞;廖宜涛;应义斌;;连续投影算法(SPA)在近红外光谱定量分析中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年

相关硕士学位论文 前1条

1 苏映雪;特征选择算法研究[D];国防科学技术大学;2006年



本文编号:2757035

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wulilw/2757035.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d5b71***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com