当前位置:主页 > 社科论文 > 社会学论文 >

纵向数据缺失处理对分析模型影响的研究

发布时间:2017-10-05 03:36

  本文关键词:纵向数据缺失处理对分析模型影响的研究


  更多相关文章: 数据缺失 纵向数据 重复测量方差分析 多重插补 混合回归模型


【摘要】:纵向数据的提出将数据模型研究推到了一个新的领域,纵向数据模型成为统计学在理论研究和实际应用中探究的重要课题。由于纵向数据结合了时间序列数据和横截面数据的特性,不仅体现了样本的时间变化趋势,还将样本的组内差异和组间差异更充分地表示出来。在相关领域的研究中为获得全面的分析需要变换时间和场合对同一对象进行重复观测来获取纵向数据。但由于获取资料所需的时间较长,实验条件变化较多,数据缺失经常发生。医学统计和生物统计的纵向研究中就常会遇到由于被观测个体的身体不适或不便、移居外地或对研究不再感兴趣等原因,不能按照事先规定的时间接受调查;甚至有的会退出研究,造成数据缺失。 纵向数据中的数据缺失可能会发生在观测时间内的任一时间点,连续时间变化趋势下的统计分析就会受到影响。数据缺失会破坏数据的完整性,影响数据的可用性,违背数据分析模型的假定,导致相应的统计分析结果出现不同程度的偏差,降低结果的准确性和精度,给研究问题的解释带来困惑,影响整个数据研究工作的质量。 在含缺失纵向数据的实际分析中,为简化问题的复杂性,往往采用删除缺失的完整观测数据。这在一定程度上减少了统计分析的样本量,而且是许多统计分析软件处理数据缺失的默认方法。但是,这种方法只有在数据是完全随机缺失,并且缺失单元与其他被观测单元不存在显著差异时才能给出合理的估计结果;否则,可能降低估计量的精度,甚至导致估计量与真值偏离较大,使得统计分析结果出现严重偏差。数据缺失的处理对模型分析具有重要的意义。 本文探讨纵向数据缺失的处理方法对分析模型的影响。选取了健康相关生活质量的实际数据(参见Gjeilo等,2008),对删除缺失的完整观测分析结果与数据缺失处理之后的统计分析结果进行了比较。EM算法和链式方程多重插补法的实际结果显示,链式方程多重插补法的效果优于其它插补方法。针对链式方程多重插补的数据集合,给出了纵向数据的几种常用模型的分析结果,并进行了比较分析。结果显示,在处理纵向数据缺失时,插补法可以更合理地利用数据信息。对含插补值数据集合的分析,要依据相应选用的统计模型以得到更合理的统计分析结果。
【关键词】:数据缺失 纵向数据 重复测量方差分析 多重插补 混合回归模型
【学位授予单位】:天津财经大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:C81
【目录】:
  • 内容摘要4-5
  • Abstract5-7
  • 目录7-8
  • 第1章 导论8-13
  • 1.1 本文研究背景及目的8-9
  • 1.3 相关研究文献综述9-12
  • 1.4 论文结构和创新之处12-13
  • 第2章 数据缺失处理13-25
  • 2.1 数据缺失的产生原因13-14
  • 2.2 数据缺失的分类14-17
  • 2.3 数据缺失的处理方法17-25
  • 第3章 常用纵向数据分析模型25-42
  • 3.1 重复测量方差分析模型26-30
  • 3.2 混合回归模型30-36
  • 3.3 协方差模式模型36-39
  • 3.4 离散结果变量分析模型39-42
  • 第4章 健康相关生活质量纵向数据的实证分析42-67
  • 4.1 健康相关生活质量的纵向数据42-45
  • 4.2 基于直接删除法的统计分析45-52
  • 4.3 基于插补集合的统计分析52-60
  • 4.4 多重插补集合下混合回归模型分析60-63
  • 4.5 多重插补集合下常用分析模型比较63-67
  • 第5章 总结67-69
  • 参考文献69-73
  • 后记73

【参考文献】

中国期刊全文数据库 前10条

1 李薇;统计调查中的数据缺失及处理[J];商业研究;2003年06期

2 茅群霞,李晓松;多重填补法Markov Chain Monte Carlo模型在有缺失值的妇幼卫生纵向数据中的应用[J];四川大学学报(医学版);2005年03期

3 薛留根;朱力行;;纵向数据下部分线性模型的经验似然推断[J];中国科学(A辑:数学);2007年01期

4 曹阳,谢万军,张罗漫;多重填补的方法及其统计推断原理[J];中国医院统计;2003年02期

5 金勇进;调查中的数据缺失及处理(Ⅰ)——缺失数据及其影响[J];数理统计与管理;2001年01期

6 金勇进;缺失数据的插补调整[J];数理统计与管理;2001年06期

7 杨军;赵宇;丁文兴;;抽样调查中缺失数据的插补方法[J];数理统计与管理;2008年05期

8 王大荣;张忠占;;线性回归模型中变量选择方法综述[J];数理统计与管理;2010年04期

9 庞新生;多重插补处理缺失数据方法的理论基础探析[J];统计与决策;2005年04期

10 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期



本文编号:974582

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/974582.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户96e15***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com