调查数据无回答的插补方法及模拟比较
发布时间:2017-12-13 13:32
本文关键词:调查数据无回答的插补方法及模拟比较
更多相关文章: 无回答 无回答率 均方误差 EM算法 MCMC方法
【摘要】:统计调查无回答是普遍存在且较难处理的问题,一直是统计学界备受关注的问题。调查数据无回答容易导致统计分析结果出现较大偏差,增加统计分析难度,降低了统计工作质量。统计调查无回答的研究具有重要的理论和应用价值。 对于调查数据无回答,最有效的是事前预防,即在调查过程中尽量提高回答率。但是,客观实际问题复杂,经验显示调查数据无回答是不可避免的。无回答的事后处理方法,特别是无回答项目的事后插补方法研究也是极其重要的。目前,我国对调查数据无回答的研究成果与国外相比还是相对较少。 实际问题不同,无回答问题的插补方法也不一样。本文总结了近年来针对调查数据无回答的几乎全部插补方法,包括直接剔除法、加权的完全个体分析、单一插补、多重插补等插补方法,并对各种方法的优良性进行了比较。 现将常用的EM插补、MCMC-Gibbs插补、回归插补和均值插补等四种插补方法在用于建立回归模型的含无回答项数据中进行了进一步的模拟研究。含无回答项数据用正态分布随机生成。对于无回答率分别为5%、10%、20%、30%、40%和50%,回归变量个数分别为2、3和5的情况进行模拟比较。模拟结果显示,在同一无回答率下,EM插补和回归插补两种方法的插补值偏差较小,均方误差也较小,MCMC-Gibbs插补的插补值偏差和均方误差相对更大,均值插补的插补值偏差和均方误差最大。随着无回答率增加,可用的样本数据所占比例减小,插补值的随机波动较大,但全部插补值的均方误差比较稳定。
【学位授予单位】:天津财经大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:C81
【参考文献】
中国期刊全文数据库 前10条
1 李薇;统计调查中的数据缺失及处理[J];商业研究;2003年06期
2 武建虎,贺佳,贺宪民,程红岩;多变量缺失数据的不同处理方法及分析结果比较[J];第二军医大学学报;2004年09期
3 张建民;姚亮;胡学钢;;一种面向数据缺失问题的K-means改进算法[J];合肥工业大学学报(自然科学版);2008年09期
4 杨基栋;;缺失数据的插补方法及其统计分析[J];华北水利水电学院学报;2010年02期
5 金勇进;缺失数据的插补调整[J];数理统计与管理;2001年06期
6 杨军;赵宇;丁文兴;;抽样调查中缺失数据的插补方法[J];数理统计与管理;2008年05期
7 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期
8 乔丽华;傅德印;;缺失数据的多重插补方法[J];统计教育;2006年12期
9 庞新生;缺失数据处理中相关问题的探讨[J];统计与信息论坛;2004年05期
10 沐守宽;周伟;;缺失数据处理的期望-极大化算法与马尔可夫蒙特卡洛方法[J];心理科学进展;2011年07期
,本文编号:1285332
本文链接:https://www.wllwen.com/shekelunwen/shgj/1285332.html