均质模型理念的应用研究
发布时间:2019-12-04 12:19
【摘要】:近红外光谱分析技术是20世纪90年代以来发展最快、最引人注目的光谱分析技术。随着计算机技术的迅速发展,带动了分析仪器的数字化和化学计量学科的发展。NIR方法主要是通过构建一系列的NIR模型,实现对产品质量的快速筛查。因此,构建预测能力强、适用范围广的NIR模型是至关重要的。NIR方法的优劣与所采用的模型关系密切。好的NIR模型不仅与模型所选择的建模谱段、预处理方法、算法有关,更与建模训练集样本的代表性关系密切。理想的训练集样本应能覆盖预测样品的全部变异范围,但其样本数并不是越多越好,样本数过多引入误差的机会就越多,样本量过少又不能包括全部组分与背景的特征信息,因此必须从大量的样本中挑选出适宜的建模样本。当NIR模型在应用中遇到训练集样本未涉及的新样本时,模型的预测结果可能出现较大偏差。此时,可以通过模型更新法扩展原通用性模型的适用范围。本研究以注射用头孢呋辛钠、注射用头孢曲松钠、注射用头孢唑林钠、注射用头孢哌酮钠舒巴坦钠为例,探讨均质模型理念在判断N1R模型更新指标中的验证与应用。首先,分析各注射剂原模型中均质样本的分类情况,判断当模型遇到建模训练集未包括的新的均质样本时,原模型即认为不能满足预测的需要,需要对模型进行更新;其次,将建模样品全波段光谱与训练集样本平均光谱的相似系数(r1),作为判断模型需要更新的客观指标,一般认为当r199.0%时,模型需要更新;通过本研究发现,当原模型各均质样本间,光谱数量分布不均,导致模型对某些光谱数量较少的均质样本在预测时,预测偏差较大,此类情况被认为是样本分布有失均衡,此时,98.0%r199.0%,模型对样本的整体预测水平可以接受,但通过补充数量较少的均质样本的方法,实现对模型的优化,提高模型的预测能力:同时结合不同样品的实际情况,将模型更新的指标加以验证和细化。在对模型进行更新时,分别采用相关系数法和聚类分析法筛选新样本;相关系数法则是以新光谱与原模型训练集平均光谱的r1中心值为起点,以0.02%作为选样间隔,向上向下选择新光谱;同时按照均质样本的分类情况,结合PCA分布图,向原模型中补充新的均质样本,或所属类别中均质样本数量较少的样本,完成模型更新;此方法选择样本方便、快捷,避免了繁琐的样本筛选过程,提高模型更新效率。聚类分析法是在聚类分析图最大距离的1/50处将新光谱分为若干类,然后向原模型中随机加入一定数量的各类新光谱,完成模型更新;通过比较两种更新方法的平均预测偏差,发现两种更新方法的预测结果基本一致,初步判断可以将相关系数法作为聚类分析法的替代方法,应用于模型更新样本的选择。另外,本研究以头孢克肟干混悬剂、颗粒剂、非铝塑胶囊剂、非铝塑片剂为样本,探讨均质样本在构建头孢克肟通用性定量模型中的应用。分别采用相关系数法(模型12)和聚类分析法(模型13、模型14)选择建模样本:按照各剂型中均质样本的分布情况,合理选择每一类均质样本的数量,同时结合新光谱在PCA分布图中的位置,选择建模样本,建立头孢克肟通用性定量模型;模型的平均预测偏差分别为3.03%、3.04%和3.13%;在对模型进行优化时,向模型中补充预测偏差大于5%的新光谱,同时兼顾增加均质样本数量相对较少的光谱,可以有效提高模型的预测能力,更新后模型的平均预测偏差分别为2.63%、2.65%和2.90%。通过研究,为合理选择建模样本和模型更新样本提供参考。
【图文】:
训练集、验证集和新光谱)的聚类分析图。可见,选择ri或rr的聚类结果虽然逡逑略有差异,但全部光谱均可明显分为H类,每-类分别代表一个均质样本(表9)。逡逑由图3可见,新光谱分别属于原模型中的第一和第二均质样本;通过计算新光谱逡逑与其所属均质样本平均光谱的相关系数可知,属于第2类均质样本的新光谱与原逡逑模型训练集第2类均质样本平均光谱之间的n.部分ri<99.0%,且n>99.0%或逡逑r,,<99.0%的样本无明显分布规律;由原模型对新光谱的预测偏差可知,原模型能逡逑够实现对新光谱的预测(平均预测偏差为1.47%);虽然最大预测偏差为4.0%,逡逑但通过比较相关系数r,与预测偏差之间的关系发现,两者之间无明思的相关性,逡逑提示其可能为偶然误差;因此,原模型可W较准确的巧测新光谱的含量(表6);逡逑即模型B无需更新。逡逑17逡逑
留2头巧巧辛销模型中r,写h的相关性逡逑L4.2.2头跑曲松销模型逡逑图3a和图化分别为采用全谱段和建模谱段,全部头抱曲松} 光谱(原模型逡逑训练集、验证集和新光谱)的聚类分析图。可见,选择ri或rr的聚类结果虽然逡逑略有差异,但全部光谱均可明显分为H类,每-类分别代表一个均质样本(表9)。逡逑由图3可见,新光谱分别属于原模型中的第一和第二均质样本;通过计算新光谱逡逑与其所属均质样本平均光谱的相关系数可知,属于第2类均质样本的新光谱与原逡逑模型训练集第2类均质样本平均光谱之间的n.部分ri<99.0%,且n>99.0%或逡逑r,<99.0%的样本无明显分布规律;由原模型对新光谱的预测偏差可知,原模型能逡逑够实现对新光谱的预测(平均预测偏差为1.47%);虽然最大预测偏差为4.0%,逡逑但通过比较相关系数r
【学位授予单位】:北京协和医学院
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O657.33;R91
本文编号:2569610
【图文】:
训练集、验证集和新光谱)的聚类分析图。可见,选择ri或rr的聚类结果虽然逡逑略有差异,但全部光谱均可明显分为H类,每-类分别代表一个均质样本(表9)。逡逑由图3可见,新光谱分别属于原模型中的第一和第二均质样本;通过计算新光谱逡逑与其所属均质样本平均光谱的相关系数可知,属于第2类均质样本的新光谱与原逡逑模型训练集第2类均质样本平均光谱之间的n.部分ri<99.0%,且n>99.0%或逡逑r,,<99.0%的样本无明显分布规律;由原模型对新光谱的预测偏差可知,原模型能逡逑够实现对新光谱的预测(平均预测偏差为1.47%);虽然最大预测偏差为4.0%,逡逑但通过比较相关系数r,与预测偏差之间的关系发现,两者之间无明思的相关性,逡逑提示其可能为偶然误差;因此,原模型可W较准确的巧测新光谱的含量(表6);逡逑即模型B无需更新。逡逑17逡逑
留2头巧巧辛销模型中r,写h的相关性逡逑L4.2.2头跑曲松销模型逡逑图3a和图化分别为采用全谱段和建模谱段,全部头抱曲松} 光谱(原模型逡逑训练集、验证集和新光谱)的聚类分析图。可见,选择ri或rr的聚类结果虽然逡逑略有差异,但全部光谱均可明显分为H类,每-类分别代表一个均质样本(表9)。逡逑由图3可见,新光谱分别属于原模型中的第一和第二均质样本;通过计算新光谱逡逑与其所属均质样本平均光谱的相关系数可知,属于第2类均质样本的新光谱与原逡逑模型训练集第2类均质样本平均光谱之间的n.部分ri<99.0%,且n>99.0%或逡逑r,<99.0%的样本无明显分布规律;由原模型对新光谱的预测偏差可知,原模型能逡逑够实现对新光谱的预测(平均预测偏差为1.47%);虽然最大预测偏差为4.0%,逡逑但通过比较相关系数r
【学位授予单位】:北京协和医学院
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O657.33;R91
【参考文献】
相关期刊论文 前10条
1 丁柯;张月敬;沈广辉;于贤龙;杨增玲;刘贤;;蛋白饲料原料粗蛋白含量近红外光谱模型转移研究[J];光谱学与光谱分析;2016年05期
2 洪永胜;于雷;耿雷;张薇;聂艳;周勇;;应用DS算法消除室内几何测试条件对土壤高光谱数据波动性的影响[J];华中师范大学学报(自然科学版);2016年02期
3 贾帅芸;徐冰;杨婵;崔向龙;史新元;乔延江;;基于SIC算法的丹参醇提过程近红外定量模型更新研究[J];中国中药杂志;2016年05期
4 薛忠;徐冰;张志强;史新元;付静;杜新刚;乔延江;;药物粉末混合过程在线监控技术研究进展[J];中国药学杂志;2016年02期
5 王菊香;孟凡磊;刘林密;崔伟成;;样品选择结合分段直接校正法和偏最小二乘法用于近红外光谱分析模型传递研究[J];兵工学报;2016年01期
6 罗峻;聂凤明;吴淑焕;范伟;许敏;;纺织品快速无损检测校正模型的转移与共享研究[J];中国纤检;2016年01期
7 张文君;唐红;蒋巧勇;;不同光照下的近红外光谱模型传递研究[J];中国测试;2015年12期
8 匡静云;管骁;刘静;;原料乳中蛋白质与脂肪的近红外光谱快速定量研究[J];分析科学学报;2015年06期
9 宋海燕;秦刚;;土壤有机质近红外预测FIR模型传递算法研究[J];光谱学与光谱分析;2015年12期
10 王家俊;者为;刘言;蔡文生;邵学广;;基于拓展光谱的近红外光谱模型转移方法[J];中国烟草学报;2014年06期
本文编号:2569610
本文链接:https://www.wllwen.com/kejilunwen/huaxue/2569610.html
教材专著