超高维数据中非线性模型的交互作用研究
发布时间:2021-08-11 12:32
关于超高维数据的统计模型研究,多数现有的变量选择和筛选研究都集中在线性回归模型。然而,在一些复杂情况下,响应变量和预测变量为非线性相关,简单的线性模型不够灵活,无法涵盖非线性模型结构。基于复杂的非线性问题,本文研究超高维情况下稀疏性非参数可加模型的变量选择问题,即确定模型中响应变量的相关变量,包括主成分和交互作用两部分。本论文的主要内容和结论如下:1.变量选择第一部分,本文提出非参数向前选择法(Nonparametric For-ward Selection)选择模型的主成分变量,该方法简单高效且易于实现。由理论分析可得,其在一定的正则条件下具有变量筛选一致性,这一结果在预测变量维数远大于样本量的情况同样成立。模拟部分和实际数据分析部分一致表明,该方法适用于非参数可加模型中一定样本量和大尺寸数据的主成分变量筛选;且在一定程度上,该方法优于一些其他方法。2.变量选择第二部分,关于非参数模型的交互作用选择,本文提出基于向前选择的两步法:交互作用的非参数向前选择法(inter-Nonparametric FORward-Two)。该算法只涉及最小二乘法(Ordinary Least Squa...
【文章来源】:太原理工大学山西省 211工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图3.1:?RSS减小趋势及4种准则比较??
预测变量独立%?SiV丑w?9;当t?=?1,预测变量的两两相关系数为0.5,?e?7.9。f?=?0??情况下模型的真实函数和函数估计拟合如图3所示。??此外,我们还考虑例3的一种“高频”情况,用%(&C)和似(4?)代替釣⑷,你⑷。相??应的價噪比为SiVi??w?9?(#?=?0)和5见R???8.1?(i?=?1)???21??
?1382379?-?at,?1373843?-?at,?1378178?-?at,?1379574?-?at,?1390304?-?at,?1382651?-?at,??1373319?—ai,1388755?—ai。INIS-penGAM(p?=?2000)选择8?个探针组,penGAM(p?=?2000)选??择32个探针组。NFS选择结果的拟合函数如图3.4所示,表3.6给出了拟合的残差平方??和RSS。当p?=?3000和p?=?5000情况下使用NFS方法,分别选择10个探针组和12个探??针组时,探测组1380089?-?at和1370966?-?at被一致选择。??进一步评估NFS的预测性能,计算模型的预测均方误差PE?(prediction?mean?square??error)。由于在具体数据拟合中,模型自由度应大于数据的观测个数,仲m函数包要求??28??
本文编号:3336164
【文章来源】:太原理工大学山西省 211工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图3.1:?RSS减小趋势及4种准则比较??
预测变量独立%?SiV丑w?9;当t?=?1,预测变量的两两相关系数为0.5,?e?7.9。f?=?0??情况下模型的真实函数和函数估计拟合如图3所示。??此外,我们还考虑例3的一种“高频”情况,用%(&C)和似(4?)代替釣⑷,你⑷。相??应的價噪比为SiVi??w?9?(#?=?0)和5见R???8.1?(i?=?1)???21??
?1382379?-?at,?1373843?-?at,?1378178?-?at,?1379574?-?at,?1390304?-?at,?1382651?-?at,??1373319?—ai,1388755?—ai。INIS-penGAM(p?=?2000)选择8?个探针组,penGAM(p?=?2000)选??择32个探针组。NFS选择结果的拟合函数如图3.4所示,表3.6给出了拟合的残差平方??和RSS。当p?=?3000和p?=?5000情况下使用NFS方法,分别选择10个探针组和12个探??针组时,探测组1380089?-?at和1370966?-?at被一致选择。??进一步评估NFS的预测性能,计算模型的预测均方误差PE?(prediction?mean?square??error)。由于在具体数据拟合中,模型自由度应大于数据的观测个数,仲m函数包要求??28??
本文编号:3336164
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3336164.html