当前位置:主页 > 科技论文 > 数学论文 >

线性回归模型参数估计及异常点检测方法的改进

发布时间:2018-04-13 01:30

  本文选题:K综合主成分估计 + 函数型岭估计 ; 参考:《山东大学》2015年硕士论文


【摘要】:线性回归模型作为统计学科中最基础、应用最广泛的数学模型,是探求变量间关系、分析数据有效性的有力工具。本文主要围绕:线性回归模型参数估计方法、线性回归模型异常点检测方法两部分展开研究,针对各自的研究方法给予了理论上的改进与程序上的实现。回归模型建立的目的在于得到变量之间的相关关系,即参数估计。经典的参数估计思想是使估计偏差的平方最小,称为最小二乘估计。在Gauss-Markou假设下,最小二乘估计是无偏估计类中方差最小的估计方法。当自变量之间存在某种近似的线性关系时,会导致最小二乘估计的均方误差很大。前人针对传统方法的不足,提出了主成分估计与岭估计。本文对上述方法进行了综合与改进,提出了K综合主成分估计。该方法将特征值矩阵A按照矩阵XrX特征值的大小划分为人1和人2两部分,并在包含少部分信息的人2中加上K=diag(kq+1,…,kp),其中常数kj≥0,j=q+1,...,p.然后给出了K综合主成分估计在均方误差意义下优于最小二乘估计以及广义岭估计的条件。传统的岭估计只考虑对特征值加同一个常数k的情况,未考虑对不同特征值加不同常数的情况。本文又提出了函数型岭估计,在特征值矩阵人1中加上关于K的函数矩阵F(K)=diag(f1(k1),f2(k2),…,fq(kq)),其中已知函数fi(ki),i=1,...,q满足一定的非负与可微性条件。理论上证明了函数型岭估计在均方误差意义下优于主成分估计和最小二乘估计的条件,以及在广义均方误差意义下优于最小二乘估计的条件。回归模型建立时需要剔除与原定模型偏差大的数据,即异常点检验。本文对异常点检验的常用方法进行了细致的讨论与研究。在数据删除模型中,删除一行或多行样本数据,会遇到设计阵X为非列满秩的情况。而最小二乘估计是基于设计阵列满秩的假设下进行参数估计的。若不满足,则矩阵XTX无法求逆。为了克服这种情况,本文考虑利用广义逆的思想,通过奇异值分解的方法来求矩阵XTX的广义逆;在均值漂移模型中,t统计量是判断异常点的常用统计量。本文利用MATLAB软件编程,随机生成了自变量和误差项的样本数据,根据给定的回归模型计算因变量的值,得到参数的最小二乘估计。并利用对样本点施加“扰动”的思想,对t统计量的灵敏度进行了模拟评估;在异方差模型中,本文将经典的Lagrange乘子法引入异常点检验。将齐方差性假设作为加权最小二乘估计的约束条件,根据Lagrange乘子法的核心思想将此约束最优化问题转化为无约束最优化问题,不再需要构造检验统计量和计算分布函数。最后,本文通过实例进行了方法实现。
[Abstract]:The linear regression model is the most basic and widely used mathematical model in the statistical discipline . It is a powerful tool for finding out the relationship between variables and analyzing the validity of data .
In the mean - drift model , the t - statistic is a common statistic for judging the abnormal points . In this paper , the sample data of arguments and error terms are randomly generated by using MATLAB software , and the value of the dependent variable is calculated according to a given regression model , and the least square estimation of the parameters is obtained . The sensitivity of the t statistic is simulated by applying the idea of " disturbance " to the sample points ;
In the heteroscedasticity model , the classical Lagrange multiplier method is introduced into the anomaly point test . As the constraint of weighted least square estimation , the constraint optimization problem is transformed into unconstrained optimization problem according to the core idea of Lagrange multiplier method , and it is no longer necessary to construct the test statistic and the calculation distribution function . Finally , the method is implemented by way of example .

【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:O212.1

【相似文献】

相关期刊论文 前10条

1 张二艳;许燕;;利用配方法求解最小二乘估计的的应用研究[J];北京印刷学院学报;2009年06期

2 吴慎言;;最小二乘估计器存在性的研究[J];西安工程科技学院学报;1992年01期

3 吴刘仓,黄文亮,詹金龙;最小二乘估计的有效性[J];昆明理工大学学报(自然科学版);2001年02期

4 崔博文,陈剑,陈心昭,任章;复参数最小二乘估计方法[J];安徽大学学报(自然科学版);2005年03期

5 肖庭延;张培培;阎金华;;正则化的最小二乘估计及其应用[J];高等学校计算数学学报;2005年S1期

6 车金锐;梁刚;陈敏茹;;基于小波测量预处理的最小二乘估计[J];数学的实践与认识;2006年04期

7 刘湘蓉;;最小二乘估计关于误差分布的稳健性[J];应用概率统计;2006年04期

8 李兵;朱宁;唐文芳;段复建;;改进的最小二乘估计确定高精度参数模型[J];统计与决策;2007年23期

9 吴如光;;约束最小二乘估计关于误差分布的稳健性[J];西安文理学院学报(自然科学版);2008年02期

10 蔺焕泉;;普通最小二乘估计方差表达式的等价性[J];长春大学学报;2010年02期

相关会议论文 前5条

1 陈欢;杨德森;时胜国;;最小二乘估计的矢量阵近场虚拟聚焦算法[A];2008年全国声学学术会议论文集[C];2008年

2 范龙;白鸽;;基于抗差最小二乘估计的载体速度计算方法[A];第二届中国卫星导航学术年会电子文集[C];2011年

3 张崇高;;Fuzzy变量的配方回归模型的最小二乘估计[A];模糊集理论与模糊应用专辑——中国系统工程学会模糊数学与模糊系统委员会第十届年会论文选集[C];2000年

4 崔博文;陈剑;陈心昭;任章;;基于U-D分解的复参数最小二乘估计方法[A];第二十三届中国控制会议论文集(上册)[C];2004年

5 刘娜;张端金;杨林;;基于SVD的偏差补偿最小二乘估计算法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年

相关博士学位论文 前1条

1 赵媛媛;信号模型中若干参数估计问题的研究[D];中国科学技术大学;2011年

相关硕士学位论文 前10条

1 苏千叶;线性回归模型参数估计及异常点检测方法的改进[D];山东大学;2015年

2 卢冬晖;约束泛最小二乘估计及其影响分析[D];湖北师范学院;2014年

3 桂咏新;奇异增长曲线模型中参数阵的最优估计及最小二乘估计的有效性[D];华中师范大学;2003年

4 于家富;回归系数的混合估计和最小二乘估计的相对效率[D];山东师范大学;2006年

5 刘洪伟;线性模型最小二乘估计递推算法[D];东北林业大学;2012年

6 王剑;线性回归系数的Stein估计[D];华中科技大学;2007年

7 尤太林;EV模型的正交回归分析[D];贵州财经学院;2011年

8 詹小平;工具变量回归中的估计问题[D];东北师范大学;2006年

9 黄超;推广增长曲线模型中协差阵的最小二乘估计及其优良性[D];华中师范大学;2001年

10 王晓光;序约束下ARCH模型最小二乘估计[D];吉林大学;2004年



本文编号:1742342

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/1742342.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9df37***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com