当前位置:主页 > 经济论文 > 技术经济论文 >

统计数据异常值诊断方法及应用

发布时间:2017-04-28 05:05

  本文关键词:统计数据异常值诊断方法及应用,由笔耕文化传播整理发布。


【摘要】:运用统计数据分析与预测国家经济特征及走势已是众多专家学者乃至业余人士的惯用方法,然而随着信息化的深入发展,人们对数据质量提出了越来越高的要求,新的数据质量诊断理论应运而生,方法越趋完善,其中对异常值的识别与处理是数据质量诊断过程中一个不可忽略的问题。本文主要从回归模型和残差分布两个方面讨论异常值的识别问题,通过对某一模型或概率分布下各种检验统计量的总结和比较,得出检验假设条件下异常值的最优方法,并运用该方法来检验我国一些宏观统计指标数据是否存在异常。 在常规回归模型中,异常值是指对既定模型偏离较大的数据点。通过建立数据删除模型来分析某一数据点对回归分析的影响,如果该点对回归方程估计量的影响超过临界值,那么就判定该点为异常值。随着经济现象之间的关系越来越复杂,很少单纯地存在简单线性关系,于是本文在总结前人关于参数与非参数模型下异常值检验的经典研究基础上,把相应方法拓展到半变系数模型中,并利用该方法以具体模型开展实际应用分析。 在样本统计数据中,异常值是指与数据集的主体并非来自同一分布的点,即与大部分数据不服从同一样本分布的点。尽管目前各国学者对正态分布、指数分布、极值分布、威布尔分布等分布下异常值的识别问题都做出了杰出贡献。在总结非正态分布下异常值检验问题的基础上,本文针对Ⅰ型极值分布提出能在任何情况下都避免屏蔽效应的新的统计量——F’型统计量;其次,概括了正态分布下异常值的各种检验统计量与检验方法,并借助“相对统计量”的概念对正态分布下三种常用的检验统计量进行了检验功效的比较。 最后,在总结和评价本文主要结论及贡献的基础上,对异常值诊断的未来发展方向做了一些展望。
【关键词】:统计数据 异常值诊断 回归模型 残差分布
【学位授予单位】:浙江工商大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:F222
【目录】:
  • 摘要2-4
  • ABSTRACT4-6
  • 目录6-8
  • 第一章 导论8-19
  • 第一节 研究背景及选题意义8-10
  • 一、研究背景8
  • 二、理论和现实意义8-10
  • 第二节 文献综述10-15
  • 一、异常值的含义10-11
  • 二、异常值产生的原因11
  • 三、异常值的诊断方法11-15
  • 第三节 研究思路及主要内容15-17
  • 一、研究思路16-17
  • 二、主要内容17
  • 第四节 研究方法与创新之处17-19
  • 一、研究方法17-18
  • 二、创新之处18-19
  • 第二章 回归模型下异常值诊断的方法及应用19-39
  • 第一节 常规回归模型下的异常值检验19-25
  • 一、参数回归模型下异常值的检验20-22
  • 二、半参数回归模型下异常值的检验22-25
  • 第二节 基于半变系数模型的异常值检验25-29
  • 一、半变系数模型的提出25-26
  • 二、PLS估计26-27
  • 三、带宽h和模型依赖变量d以及阶数p、q的选择27
  • 四、基于半变系数模型下数据删除模型的广义Cook距离27-29
  • 第三节 基于回归模型的GDP增速的异常值检验29-39
  • 一、变量选取及来源30
  • 二、模型构建30-32
  • 三、应用分析32-39
  • 第三章 基于残差分布的异常值分析39-64
  • 第一节 非正态分布下异常值检验统计量39-52
  • 一、极值分布与Weibull分布下异常值检验统计量39-48
  • 二、指数分布下异常值检验统计量48-49
  • 三、其它分布49-50
  • 四、非正态分布下异常值诊断方法的应用50-52
  • 第二节 正态分布下异常值检验52-57
  • 一、正态分布下异常值检验统计量52-56
  • 二、可以转化为正态分布的异常值检验方法56-57
  • 第三节 正态分布下几种检验统计量的比较57-64
  • 一、三种检验方法的比较57-60
  • 二、真实统计数据质量的诊断60-62
  • 三、假定异常值下的检验功效比较62-64
  • 第四章 总结与展望64-67
  • 一、总结与评价64-65
  • 二、展望65-67
  • 参考文献67-72
  • 附录72-77
  • 致谢77-78

【参考文献】

中国期刊全文数据库 前10条

1 李云飞,黄继伟,朱宏;双参数指数分布异常数据的检验[J];电子科技大学学报;2005年01期

2 朱宏;Ⅰ型极值分布样本多个异常值的检验[J];地质科技管理;1994年03期

3 曾林蕊,朱仲义,茆诗松;半参数广义线性模型的影响分析与异常点检验[J];高校应用数学学报A辑(中文版);2004年03期

4 张嵘;陈川杨;;Ⅰ型极值分布下异常值检验的最优统计量[J];科技信息(学术研究);2008年25期

5 李云飞;;指数分布多个异常数据的检验[J];内江师范学院学报;2008年04期

6 陈川杨;朱t,

本文编号:332145


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jiliangjingjilunwen/332145.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户03bde***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com