线性回归模型中的异常值检测与稳健性估计

发布时间:2021-01-04 17:06
  基于数据建立的统计模型往往由于受到异常值的影响而缺乏稳定性,使得异常值检测与稳健性估计在模型构建中变得尤为重要.异常值一般分为两种,即在响应值Y上的异常和在预测值X上的异常,前者通常称为竖直异常点,后者通常称为高杠杆值点.本文对常用的异常值检测与稳健性估计方法进行研究,着重探讨在线性回归模型中的异常值检测与稳健性估计问题,并对高维(多元)数据下的正态性检验进行了分析.在第一部分,我们利用残差空间超椭球等高面的概念构造了对已有异常值检测方法的改进方法,并得到稳健的回归参数估计.首先,我们分别利用基于边际相关系数的高维数据影响度量指标(HIM)和基于距离相关系数的HDC判别方法对数据中的异常值进行初步筛选,将数据集中的点分为正常点与异常点两类,然后在初始正常点集的基础上利用稳健的最小截断估计(LTS)方法和残差空间超椭球等高面构造了对初始正常点集误判点的纠正方法,并对初始异常点集中各点的异常值概率进行计算,以进一步纠正误判入异常点集的正常点,最终对异常值检测的准确率进行了进一步的提升.通过对两种数据结构下三种类型异常数据的模拟与真实实例的分析,我们证明了所提方法的有效性,在对异常值进行检测... 

【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校

【文章页数】:80 页

【学位级别】:硕士

【部分图文】:

线性回归模型中的异常值检测与稳健性估计


图2.1利用各方法对经过三类异常值干扰的MA结构数据进行异常值检测结果的经??验势(P=5)??

异常值,结构数据


?\?〇e?_?—?/?Z??a?〇y?\、、、、义a?:p?乂一一a?j?一一—??\?/>’?(??、?0.6-??0.4?-?\?</'??\?02????0-3-?.、?0?5-???????1?一.一????、乂?_--一”????一.??、i?k--"?r" ̄??0.01?0.02?0.05?0.08?0.1?0.6?1.2?1.8?2.4?3.0?0.4?0.5?0.6?0.7?0.8??W?K?I??图2.2利用各方法对经过三类异常值干扰的AR结构数据进行异常值检测结果的经??验势(p=5)??图2.1-2.4分别展示了利用HDC,?HIM,?MIP,?HDCP和HIMP这五种方法对被三??种不同类型异常值干扰后的两类数据进行异常值检测的结果,其中图2.1和图2.2展??示了p?=?5时的情况,图2.3和图2.4展示了p?=?15时的情形.??(1)从图2,1中我们可以看到,在MA数据结构下,当p?=?5时,随着不同类型异常??值异常程度的増加,各方法所得异常值检测结果的经验势都有所增加.其中,??在SP和RP干扰下,当〇;约小于0.025和《约大于2时,MIP的检测效果与HDC和HI??M方法相比都有所提升,但都不如本文方法所得到的效果更好.在PP干扰下,随??着t值的增加,本文算法的经验势以最快的速度增加并收敛到1.相比较而言}尽??管HDC,?HIM和MIP的经验势都有所提高,但仍然显著小于HDCP和HIMP.可??以看到,相比于其它三种方法,本文算法更能有效识别出在PP干扰下的异常值.??18??

曲线,结构数据,异常值,效果


'、???HIMP?t?^??0.4-?HIMP??-?\?\?〇5?,??\一_/??W?/?。:??〇-2?\?0.3-?????*?r—*—??\?「一?/??’?一??、.、?一f-z-- ̄zr±zzzz-z^===^—'¥'cS-- ̄^??\?0.2??一?0.0???-???1??0.01?0.02?0.05?0.08?0.1?0.6?12?1.8?2.4?3.0?0.4?0.5?0.6?0.7?0.8??(J?K?L??图2.3利用各方法对经过三类异常彳复干扰的MA结构数据进行异常值检测结果的经??验势(p=15)??(2)在AR数据结构下当1??=?5时,在SP干扰下,各方法的经验势曲线与图2.1中的??曲线趋势相似.尽管当w趋近于0.1时,HDCP和HIMP的的经验势接近甚至略??逊色于HDC和HIM,但整体而言^?HDCP和HIMP的检测效果依然要优于所比??较的方法.在RP干扰下,随着《值的增大,HDC和MIP的经验势也逐渐增大,??且MIP的检测效果整体好于HIM和HDC,但都不如HDCP和HIMP的效果更好.??此时,在PP干扰下,HDC和HIM两方法的检测效果与图2.1中的MA情形相比更??好,但同样低于HDCP和HIMP的经验势曲线.而MIP的检测效果依然最低.??(3)当p?=?15时,在MA结构下,各方法的经验势曲线在SP干扰下与p?=?5时的趋势??大体相似.随着w取值的增大,MIP的经验势依然以最大的幅度降至最低.当千??扰类型为RP时,HIM的结果好于MIP,尽管MIP的经验势在/i较大时超过HDC,??但都显著小于本文中的方法.此


本文编号:2957115

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2957115.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e7285***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com