岭估计法解决线性回归模型的多重共线性问题
发布时间:2021-02-21 02:00
在如今这个大数据时代,回归分析在各个领域中的应用是越来越广泛,经济、社会、医学、生物信息学等都有它的身影。但在研究回归分析中的线性模型时,会因为自变量之间存在多重共线性的现象从而导致模型的不稳定,甚至会出现回归系数与实际意义不相符的问题。这就需要找到解决线性模型中的多重共线性问题的方法。本文从理论和实验模拟两个方面介绍了用岭估计法解决线性模型的多重共线性问题,首先介绍了多重共线性的诊断方法,如:直观判定法、特征根判定法、方差膨胀因子法、条件数判别法等,用来得知哪些模型是存在多重共线性的,并列举了具体实例,其次介绍了解决的方法,如:剔除不重要的变量、增加样本量、回归系数的有偏估计等,着重介绍的是岭估计法,本文介绍了岭估计的概念、基本思想、性质、岭参数k的选择方法,特别地把广义岭估计、泛岭估计也应用到解决多重共线性问题中来。最后通过实例来验证本文的理论,通过数据利用SAS编写程序,发现变量之间存在多重共线性,并利用岭估计方法建立模型并使模型优化从而解决问题,本文列举了医学方面血红蛋白与微量元素的含量之间的关系,通过对数据的分析及与逐步回归分析的结果分析比较得出岭估计法更加优异;通过考察进口...
【文章来源】:渤海大学辽宁省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
进口额岭回归估计的岭迹图
渤海大学硕士学位论文49图4-13.自变量的系数随岭参数K的变化曲线图Fig4-13.Curveofcoefficientofindependentvariablewithridgeparameterk.由图可得,岭参数在0.04到0.1之间基本趋于稳定,当k0.08时,岭回归方程为:2345y424.790.0680x0.00778x17.1687x0.2239x,结论3由此可以看出,对民航旅客数影响最大的是民航路线行驶距离4x,当民航路线行驶距离增大时,民航旅客数增大;其次是中国入境游客数5x,而铁路旅客数3x影响力较小,当铁路旅客数增大时,民航旅客数降低。运用岭估计法后与原模型相比,拟合优度仍然很高,模型更加优化,回归系数有合理的经济解释;所以用岭回归估计法可以对因变量的变化趋势作预测。
本文编号:3043680
【文章来源】:渤海大学辽宁省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
进口额岭回归估计的岭迹图
渤海大学硕士学位论文49图4-13.自变量的系数随岭参数K的变化曲线图Fig4-13.Curveofcoefficientofindependentvariablewithridgeparameterk.由图可得,岭参数在0.04到0.1之间基本趋于稳定,当k0.08时,岭回归方程为:2345y424.790.0680x0.00778x17.1687x0.2239x,结论3由此可以看出,对民航旅客数影响最大的是民航路线行驶距离4x,当民航路线行驶距离增大时,民航旅客数增大;其次是中国入境游客数5x,而铁路旅客数3x影响力较小,当铁路旅客数增大时,民航旅客数降低。运用岭估计法后与原模型相比,拟合优度仍然很高,模型更加优化,回归系数有合理的经济解释;所以用岭回归估计法可以对因变量的变化趋势作预测。
本文编号:3043680
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3043680.html