线性模型中自变量相对重要性的Shapley值估计与有偏估计
发布时间:2021-11-20 21:23
研究目的本研究共有两个目的:第一,研究线性回归模型因变量总变异(R2)在各个自变量中的分割问题(相对重要性估计)与对策理论中求解Shapley值的同构性以及自变量相对重要性估计的前提条件(期望准则),根据对策理论Shapley值对自变量所有组合中逐步引入自变量时模型的R2增加值的序列与平均值,从而建立基于Shapley值法的自变量相对性估计方法,并与几种现存方法进行比较。第二,考虑到当自变量间存在多重共线性时,用普通最小二乘法建立的回归模型可能不稳定甚至是失真的,那么估计自变量相对重要性也是多余的。因此,本研究分别用实际例子及大量模拟数据探索分析乘积尺度、相对权重在偏最小二乘回归模型中自变量相对重要性估计的应用。研究方法对于第一个研究目的,本研究采用Shapley在1953年提出的对策理论法求解Shapley值法对自变量相对重要性进行估计。对第二个目的,本研究采用乘积尺度法和相对权重法的思路,模拟试验数据采用Monte Calro法进行模拟。所有的计算结果利用SAS9.2编程实现。研究结果用对策理论建立的自变量相对重要性分析方法在实际数据中估计的结果和优势分析一致,估计结果结果均优于传...
【文章来源】:宁波大学浙江省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
影响血红蛋白的自变量以不同次序进入模型的2RFig.1R2ofvariablesindifferentorderenterthemodel
图 2 提取不同潜在因子个数的偏最小二乘回归系数趋势图 Fig.2 the standard regression coefficient tendency chart by extracting different latent variables in PLS从图2 可以看出提取不同个数的潜在因子,回归系数的估计发生较大地变化。表 9 偏最小二乘回归系数及 VIP 的估计 Tab.9 estimated PLS regression coefficients and VIP statistic 观测 自变量 jβjVIP1 X10.1486 1.2811
30图 5 样本量 250,自变量个数从 3~8 的模拟样本数据的偏最小二乘回归中自变量相对重要性之和与模型总变异的差值的分布图Fig.5 the difference between variables relative importance and model variation of the Monte Claro data of250 sample size and the number of independent variables is 3 to 8 in PLS
【参考文献】:
期刊论文
[1]自变量相对重要性评价中优势分析法和相对权重法的模拟比较[J]. 伍立志,贾孝霞,沈其君,金丕焕. 中国卫生统计. 2014(01)
[2]模拟研究在线性模型自变量相对重要性估计中的应用[J]. 伍立志,贾孝霞,沈其君. 浙江预防医学. 2013(08)
[3]相对权重法在线性模型自变量相对重要性中的估计及其应用[J]. 代鲁燕,沈其君,张波,黄启风. 中国卫生统计. 2013(01)
[4]Logistic回归模型中自变量的秩优势比图[J]. 张波,黄启风,代鲁燕,沈其君. 统计与决策. 2012(24)
[5]线性回归模型中自变量相对重要性的衡量[J]. 孙红卫,王玖,罗文海. 中国卫生统计. 2012(06)
[6]线性模型中自变量相对重要性优势分析法估计及其应用[J]. 代鲁燕,黄启风,张波,伍立志,沈其君. 浙江预防医学. 2012(09)
[7]Logistic回归模型中自变量相对重要性评价方法的研究进展[J]. 张波,沈其君. 浙江预防医学. 2012(09)
[8]Logistic回归模型中自变量相对重要性的优势分析[J]. 张波,代鲁燕,黄启风,沈其君. 浙江预防医学. 2012(08)
[9]logistic回归中自变量相对重要性的相对权重估计[J]. 张波,代鲁燕,黄启风,沈其君. 中国卫生统计. 2012(02)
[10]线性模型中自变量相对重要性估计方法研究进展[J]. 代鲁燕,沈其君. 浙江预防医学. 2012(02)
本文编号:3508114
【文章来源】:宁波大学浙江省
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
影响血红蛋白的自变量以不同次序进入模型的2RFig.1R2ofvariablesindifferentorderenterthemodel
图 2 提取不同潜在因子个数的偏最小二乘回归系数趋势图 Fig.2 the standard regression coefficient tendency chart by extracting different latent variables in PLS从图2 可以看出提取不同个数的潜在因子,回归系数的估计发生较大地变化。表 9 偏最小二乘回归系数及 VIP 的估计 Tab.9 estimated PLS regression coefficients and VIP statistic 观测 自变量 jβjVIP1 X10.1486 1.2811
30图 5 样本量 250,自变量个数从 3~8 的模拟样本数据的偏最小二乘回归中自变量相对重要性之和与模型总变异的差值的分布图Fig.5 the difference between variables relative importance and model variation of the Monte Claro data of250 sample size and the number of independent variables is 3 to 8 in PLS
【参考文献】:
期刊论文
[1]自变量相对重要性评价中优势分析法和相对权重法的模拟比较[J]. 伍立志,贾孝霞,沈其君,金丕焕. 中国卫生统计. 2014(01)
[2]模拟研究在线性模型自变量相对重要性估计中的应用[J]. 伍立志,贾孝霞,沈其君. 浙江预防医学. 2013(08)
[3]相对权重法在线性模型自变量相对重要性中的估计及其应用[J]. 代鲁燕,沈其君,张波,黄启风. 中国卫生统计. 2013(01)
[4]Logistic回归模型中自变量的秩优势比图[J]. 张波,黄启风,代鲁燕,沈其君. 统计与决策. 2012(24)
[5]线性回归模型中自变量相对重要性的衡量[J]. 孙红卫,王玖,罗文海. 中国卫生统计. 2012(06)
[6]线性模型中自变量相对重要性优势分析法估计及其应用[J]. 代鲁燕,黄启风,张波,伍立志,沈其君. 浙江预防医学. 2012(09)
[7]Logistic回归模型中自变量相对重要性评价方法的研究进展[J]. 张波,沈其君. 浙江预防医学. 2012(09)
[8]Logistic回归模型中自变量相对重要性的优势分析[J]. 张波,代鲁燕,黄启风,沈其君. 浙江预防医学. 2012(08)
[9]logistic回归中自变量相对重要性的相对权重估计[J]. 张波,代鲁燕,黄启风,沈其君. 中国卫生统计. 2012(02)
[10]线性模型中自变量相对重要性估计方法研究进展[J]. 代鲁燕,沈其君. 浙江预防医学. 2012(02)
本文编号:3508114
本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/3508114.html