回归模型中的非局部相似性研究

发布时间:2021-07-14 23:39
  线性模型是用来描述多个变量之间线性关系的模型,在成分研究中应用得十分广泛.模型选择理论可以用于确定真实线性模型中的变量.目前,常用的模型选择方法,如逐步回归,AIC信息准则,以及贝叶斯方法等,都是假设数据集的特征是局部的,即仅仅利用单个变量值来构建模型.然而,在许多实际问题中,单个变量的变异性以及变量之间较大的相似性普遍存在,导致这些方法存在决策精度低,小系数变量和相似伪变量无法识别,甚至无法解决变量的决策.主要的原因是这些方法都是基于拟合优度,没有充分地挖掘数据的特征,受到变异性和相似性的严重干扰,从而使得在模型中确定合适的阈值达以到理想的目标函数变得非常困难,甚至不可能.为了解决这一问题,在向前逐步回归模型的基础上,本文提出回归自变量和残差的非局部特征相似性分析模型.向前逐步回归模型的一个重要原则是追求最优的拟合优度缺失(Lack of Fitness),简称为LOF原则.基于该原则,本文提出窗口调整的拟合优度缺失原则(Window-Adjusted Lack of Fitness),简称为WALOF原则.在考虑回归拟合优度缺失的同时,还考虑了回归残差在变量特征片段上的拟合优度缺失... 

【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校

【文章页数】:43 页

【学位级别】:硕士

【部分图文】:

回归模型中的非局部相似性研究


LOF方法流程图

拟合曲线,拟合曲线,镇静剂,复合物


收到强度变异性的干扰比较大,所以利用特征的相似性去判断成分的真实性就变得非常重要.图(3-2)给出了错误拟合曲线和正确拟合曲线的比较,以及错误识别的第五种镇静剂频谱.可以看到,复合物的绝大多数特征都被拟合出来了.然而,在第一个图中,可以看到大约波长1240处,蓝色曲线出现了一个明显的突起,这一特征在复合物曲线上是不存在的.在第二个图中,可以看到第五种镇静剂Lorazepam在该区域也存在一个明显突起.尽管该镇静剂导致了最优的相对误差平方和,但是很大可能不是真实的成分.因为其在这个区域带来了在复合物上不存在的特征.图3-2错误拟合曲线和正确拟合曲线的比较同样的分析,一个真实成分必定能够拟合复合物中的某些特征,因此在其独特特征的区域,该成分与拟合前的误差应该存在相似度较高的性质.回归系数小的变量,即使出现在复合物中,往往在LOF提升的贡献不大.图(3-3)给出了某复合物在最后一个出现的镇静剂的识别.该复合物包含五种镇静剂Estazolam,Oxazepam,Alprazolam,Triazolam和Lorazepam.除了第二种Oxazepam,其它均已正确识别.此镇静剂的拟合系数为0.1185,其它四种镇静剂回归系数分别为(0.5142,0.3621,0.6940,0.4132),可见此镇静剂在复合物中的浓度较低.由它计算出来的LOF提升,最大LOF提升和平均LOF提升分别为(0.0799,0.2650,0.0786),均比较小,由优度拟合原则,很容易因为对LOF的提升不够拒绝该镇静剂的出现.然而,考察其频谱和回归前残差,很明显在许多特征区域中存在相似,有四个特征区域的相关系数大于0.7,最大为0.8535.因此,该镇静剂很可能出现在复合物中.综合以上分析,分析残差和成分在特征区域的相似性是非常必要的.在成分变量存在大量相似特征的时候,以及变量存在变异性时,仅仅依靠拟合优度,很难13

示意图,回归系数,变量,原理


兰州大学硕士学位论文回归模型中的非局部相似性研究图3-3较小回归系数变量的检测原理示意图给出一个合理的目标来识别变量是否出现在真实模型中.而相似性分析能够提取残差中的特征,并且和待测变量进行比较,通过统计学习来判断其是否出现,这种原理极大地提高了复合物中出现变量的识别精度.在实验结果部分可以看到其优秀的表现.3.2.2窗口的确定WALOF方法的首要的任务是特征分离,这些特征在频谱上往往有峰值和峰的形状等因素来决定,这需要我们将各个成分光谱分成一个一个小的窗口,每个窗口都包含一个峰值,这里我们给出定义窗口的算法:1.识别波峰:对于每一条成分光谱,首先要将它的波峰都识别出来,这里我们认为波谱上某一点比它左侧N个点高并且比它右边N个点也高时,这个点就是波峰.我们需要找出每条光谱上符合这个条件的点,将它的位置记录下来,即P={p|Sp=max{SpN,SpN+1,...,Sp,Sp+1,Sp+2,...,Sp+N}},集合P表示的是波峰位置的集合,Si,i=pN,pN+1,...,p,p+1,...,p+N表示的是每条成分光谱上的点.2.识别波谷:波谷的识别比较简单,对于步骤一中寻找出来的波峰,每两个相邻波峰之间的最低点就是波谷,同样把波谷的位置记录下来,即B={b|Sb=min{SPi,SPi+1,SPi+2...,SPi+1}},集合B表示的是波谷的位置的集合.3.初始窗口:两个相邻的波谷及它们中间的点形成一个窗口,窗口的左,右端点都是波谷,分别记为B1...B2,B1...B2之间只包含一个波峰记为P,则窗口就被定义为WB1PB2,每个窗口只包含一个波峰,注意:对于每条成分光谱第一个窗口,它的左端点为整个成分光谱最左端的点与第一个峰值点之间的最低点,即SB11=min{S1,S2,...,SP1},而对于每条成分光谱的最后一个窗口,它的右端点为最后一个波峰到整条光谱的最后一个点之间的最低点,即14


本文编号:3285125

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3285125.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户96c96***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com