当前位置:主页 > 科技论文 > 数学论文 >

基于Gamma分布缺失数据的分位数估计

发布时间:2018-07-20 12:58
【摘要】:缺失数据普遍存在于实验研究和社会调查领域中,数据缺失问题造成分析任务加重和统计结果的不准确性.如何有效的处理缺失数据,怎样才能充分利用数据信息,准确地反映研究群体的特征,达到预期研究目的,已成为当前统计研究中的难点和热点问题.由于缺失数据往往包含了总体的一些重要信息,要想把统计分析的方法应用到处理缺失数据的领域,大体思路就是先对不完备数据进行填补,从而得到完整的数据集,再对这个数据集进行分析,所得到的结论才能保证准确的反应真实情况.本文针对非随机缺失机制下的数据缺失问题,在一定的假设前提下,由已观察数据,利用概率统计的方法给出补充数据,并结合矩估计给出了分布参数的统计推断,进而给出完全数据的概率分布的分位数估计,我们比较关心的是中位数(0.5分位数)、四分位数(分别是第一四分位数/0.25-分位数,第三四分位数/0.75-分位数)以及0.05分位数和0.95分位数.同时我们在总体服从Gamma分布,并且成功概率为指数分布(参数λ可根据Gamma分布的参数和缺失数据比例来给定)的假设下,对Gamma分布的参数和分位数做了估计,给出了参数的迭代公式.在模拟研究阶段,利用R语言,分别对缺失比例为1/10、1/5、1/2、2/3进行了模拟研究,并对模拟结果进行互相对比,得到了较好的结果.生活中很多时候两参数模型不能满足实际需要,所以我们在此基础上把模型推广到三参数下,并给出了参数的迭代公式,对成功概率参数选取问题做了说明.对后续处理一些数据缺失问题给予一定的帮助.
[Abstract]:Missing data generally exist in the field of experimental research and social investigation. The problem of missing data results in the analysis task and the inaccuracy of statistical results. How to deal with the missing data effectively, how to make full use of the data information, accurately reflect the characteristics of the research group, and achieve the expected research goal, has become a difficult and hot issue in the current statistical research. Because the missing data often contain some important information of the whole, if we want to apply the statistical analysis method to the field of processing missing data, the general idea is to fill in the incomplete data first, so as to get the complete data set. Then the data set is analyzed and the conclusion is obtained to accurately reflect the true situation. In this paper, for the data missing problem under the non-random deletion mechanism, under certain assumptions, the supplementary data are given by the method of probability and statistics, and the statistical inference of the distribution parameters is given by using the method of probability and statistics on the premise of certain assumptions. Then we give the quantile estimation of the probability distribution of complete data. We are more concerned with the median (0.5 quartile), the quartile (the 14th quartile / 0.25-quartile, respectively), the quartile, the quartile and the quartile. The third quartile, the 0.05 quartile, and the 0.95 quartile. At the same time, we estimate the parameter and quantile of Gamma distribution under the assumption that the probability of success is exponential distribution (parameter 位 can be given according to the parameter of Gamma distribution and the ratio of missing data). The iterative formula of parameters is given. In the stage of simulation research, R language is used to simulate the missing ratio of 1 / 10 / 1 / 5 / 2 / 2 / 3, and the simulation results are compared with each other and good results are obtained. In many cases, the two-parameter model can not meet the actual needs, so we extend the model to three-parameter model, and give the iterative formula of the parameters, and explain the problem of parameter selection of success probability. It is helpful to deal with some problems of missing data in the future.
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O212.1

【参考文献】

相关期刊论文 前8条

1 谢民育;吴茗;熊明;宁建辉;;指令性抽样下总体均值和方差的估计及其应用[J];应用数学学报;2010年02期

2 张星;郝伟;;不完备或缺失数据及其填补方法研究[J];福建电脑;2007年04期

3 刘富春;;基于修正容差关系的扩充粗糙集模型[J];计算机工程;2005年24期

4 庞新生;缺失数据处理中相关问题的探讨[J];统计与信息论坛;2004年05期

5 王国胤;Rough集理论在不完备信息系统中的扩充[J];计算机研究与发展;2002年10期

6 金勇进;缺失数据的插补调整[J];数理统计与管理;2001年06期

7 金勇进;缺失数据的加权调整(系列之Ⅳ)[J];数理统计与管理;2001年05期

8 金勇进,朱琳;不同差补方法的比较[J];数理统计与管理;2000年04期

相关硕士学位论文 前1条

1 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年



本文编号:2133593

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/2133593.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c692***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com