缺失数据的多重插补及其改进
发布时间:2020-08-22 20:30
【摘要】: 在统计调查中,经常会遇到缺失数据的现象。产生缺失数据的原因有多种,不同背景下的缺失数据对统计分析会带来不同的影响。当出现缺失数据时,要想提高统计调查数据的质量,可以采取对不完整的数据集进行处理,以减小由于缺失数据带来的影响。本文主要对多重插补处理方法的理论基础做了深入探讨,介绍了多重插补法处理缺失数据的基本思想,研究了对缺失值采取多重插补的方法来填补尽量减小由于缺失值而造成的统计误差。在多重插补法的基础上,当一个矩形连续数据集看起来有一个比正态分布还长的尾巴,或者是它包含了一些对正态分布的统计推断有影响的数据,多元t分布作为多元正态分布的替代分布,对于多重插补来说变的很有用了。第一如果数据有比正态分布还长的尾巴,使用多元t分布插补的数据集,相对于使用删除有影响数据的正态分布来说,可以得到更加有效的统计推断。第二,多元t分布在稳健统计推断等应用统计方面使用非常广泛。最后,通过具体的实例验证了这个方法的有效性。总之这些插补方法的讨论与改进对统计问题中经常遇到缺失数据问题有十分重要的意义。
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:C813
【图文】:
在临床治疗实脸的例子中通过使用t分布的袖人得到的
本文编号:2801111
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:C813
【图文】:
在临床治疗实脸的例子中通过使用t分布的袖人得到的
【引证文献】
相关期刊论文 前1条
1 刘冬喜;;缺失数据的填充及回归系数的条件部分根方估计[J];西南师范大学学报(自然科学版);2010年06期
相关博士学位论文 前1条
1 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年
相关硕士学位论文 前9条
1 刘志永;基于非随机缺失机制的模式混合模型医学应用研究[D];山西医科大学;2011年
2 邓银燕;缺失数据的填充方法研究及实证分析[D];西北大学;2010年
3 曾洁美;数据缺失处理在“绿色矿山”中的应用[D];安徽工业大学;2012年
4 林东方;基于EM算法的不完全测量数据的处理方法研究[D];中南大学;2012年
5 王宁;多采样率数据下的主元分析及其在过程监测中的应用[D];东北大学;2011年
6 刘艳玲;调查数据无回答的插补方法及模拟比较[D];天津财经大学;2012年
7 李淑婷;成都市大气环境污染时空特征分析及质量评价[D];电子科技大学;2012年
8 孙晶晶;虚拟数据在人工湿地模型建立过程中的理论方法与应用研究[D];青岛理工大学;2012年
9 姚亚;数据预处理和直方图时间序列在水质预测中的应用[D];浙江大学;2013年
本文编号:2801111
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2801111.html