缺失数据下的有限混合计数数据模型的统计推断研究
发布时间:2017-07-19 04:16
本文关键词:缺失数据下的有限混合计数数据模型的统计推断研究
更多相关文章: 零膨胀 有限混合 缺失数据 随机EM算法 模型选择
【摘要】:计数数据(Count data)是一类十分常见的离散型数据,其数值只能是0,1,2,…等非负整数,它所描述的是单位时间或空间内某事件出现的频数。如不合格品数、缺陷数、交通事故数、医院挂号数和森林火灾数等不能连续取值只能用自然数来表示的一类数据,这类数据就被称为计数数据。它广泛存在于金融保险、生物医学、遗传学、临床诊断以及心理学等多个研究领域中。正是因为事件数的特殊取值,所以对于计数数据的研究,最常见的是使用Poisson模型或负二项分布模型来进行回归分析。Poisson回归模型是计数数据分析的基本模型,被广泛的应用到不同领域的研究中,是以事件发生相互独立为前提,发生率保持一致性,即要求先前发生的事件对以后事件的发生没有影响,且条件均值等于条件方差,这一假设在实际应用中往往得不到满足,而负二项回归就是在这种情况下对Poisson回归的一种扩展。然而在现实情境中,所研究的计数数据往往会出现较大的变异——方差的变化大于其均值的变化,则称这类计数数据是散度偏大的(over-dispersion)。导致计数数据出现散度偏大的原因有很多,可能是计数数据中包含了过多的零观测,当零观测的比例远远超过Poisson回归或负二项回归的预测能力时,就会表现出零膨胀现象(zero-inflated)。如果仍然采用Poisson回归或负二项回归分析计数数据,就有可能得到错误的推断结果。除了零膨胀的原因外,也有可能是因为观测数据存在缺失的影响,缺失数据不仅会导致统计推断中估计量出现偏差,还会导致估计方差的增大。还有可能是因为总体来源的“异质性”以及上述因素的综合作用等。根据不同的原因建立不同的模型,使得对数据的分析变得复杂,如果不能对其进行合理的解释,可能会导致有偏差的统计推断。本文在上述背景下研究了计数数据模型的统计推断,并进一步提出了带有缺失数据的Poisson-Hurdle有限混合模型,对模型参数和混合比例的极大似然估计提出了随机EM算法。具体来说,缺失数据重点考虑了随机缺失(MAR)和非随机缺失(MNAR),为了加速收敛以及方便抽样,采用了基于数据添加的probit回归建立起缺失数据模型。对于有限混合的参数估计而言,传统的EM算法常常会收敛到局部极大而非全局极大上,为了解决这一难题,本文提出了一类有效的随机EM算法,事实上,该算法可以视为多重插补程序的一部分,在实际应用中,该算法由于随机步的驱动,能够有效避免落入局部极大的陷阱而成功找到全局极大。在模型选择方面,本文采用了基于Q函数的BIC信息准则以选择混合成份的个数。我们的模型是建立在广义模型框架下,捕获了计数数据分析的重要特征,如零膨胀或零聚集、异质性、缺失等,在数据特征上提供给我们更多的见解,允许更全面和更正确地研究散度,为合理研究计数数据提供了技术上的参考。文章的最后用模拟研究和实例说明我们方法的实用性和有效性。
【关键词】:零膨胀 有限混合 缺失数据 随机EM算法 模型选择
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:C81
【目录】:
- 摘要5-7
- Abstract7-11
- 第一章 绪论11-19
- 1.1 研究背景11-13
- 1.2 缺失数据13-14
- 1.3 有限混合模型概述14-16
- 1.4 EM算法介绍16-17
- 1.5 本文的主要工作17-19
- 第二章 零膨胀计数数据模型19-27
- 2.1 计数数据模型19-22
- 2.1.1 二项分布20
- 2.1.2 Poisson分布20-21
- 2.1.3 负二项分布21-22
- 2.2 零膨胀模型22-25
- 2.2.1 ZIP模型22-23
- 2.2.2 ZIGP模型23-24
- 2.2.3 ZINB模型24-25
- 2.3 Hurdle模型25-27
- 第三章 基于缺失数据的Poisson-Hurdle混合模型27-43
- 3.1 有限混合模型27-28
- 3.2 Poisson-Hurdle模型28-29
- 3.3 回归设定29-30
- 3.4 响应变量缺失模型30
- 3.5 极大似然估计和随机EM算法30-34
- 3.5.1 数据添加31-32
- 3.5.2 随机EM算法32-34
- 3.6 模型选择34
- 3.7 模拟研究和实例分析34-43
- 3.7.1 模拟研究34-37
- 3.7.2 实例分析37-43
- 第四章 结论与展望43-45
- 致谢45-47
- 参考文献47-53
- 附录A 攻读硕士学位期间发表论文目录53
【参考文献】
中国期刊全文数据库 前1条
1 秦永松;雷庆祝;;含结构参数的二元正态混合模型齐一性的修正似然比检验[J];中国科学(A辑:数学);2007年12期
,本文编号:561176
本文链接:https://www.wllwen.com/shekelunwen/shgj/561176.html
教材专著