当前位置:主页 > 科技论文 > 数学论文 >

无穷可分与复合Poisson律:相关计数数据模型、高维变量选择

发布时间:2017-06-22 14:08

  本文关键词:无穷可分与复合Poisson律:相关计数数据模型、高维变量选择,,由笔耕文化传播整理发布。


【摘要】:本文借助母函数等工具研究了离散复合Poisson分布(简称DCP分布)的概率理论性质、统计推断与数值计算,对DCP分布和相关回归模型做了较全面的综述,并特别地探讨了计数数据回归的惩罚估计。本文的DCP分布有如下形式的母函数:著名的Felller刻画是:离散复合Poisson分布等价于离散无穷可分分布,这可视为Levy-Khintchine无穷可分分布刻画的特例情况。特别地,当{αi}i=1∞可取负值且之和是绝对收敛时,称之为伪离散复合Poisson分布,它继承了DCP分布的部分性质。第一章介绍了本文的重要工具(母函数和Fourier变换),完善了Felller关于离散无穷可分刻画的证明;对Lasso等高维变量选择方法进行了简介;介绍了Bayesian Lasso方法,讨论了先验分布无穷可分的情况,并设想以适当的零膨胀分布作为先验分布得到稀疏非零系数的估计。第二章讨论了DCP分布(过程)的刻画,并且在附录里列举了对其概率质量函数的十种不同证明,对文献中DCP分布的百余种特例或子族进行整理。本章用Stein-Chen方法和算子半群方法研究了独立离散随机变量之和与相对应的DCP分布的全变差上界估计,还得到了DCP分布的三角阵逼近。第三章讨论了DCP分布的统计量、参数估计以及FFT算法、离散Kolmogorov-Smirnov检验。第四章研究了基于DCP分布的一些统计应用:1)运用第三章的累积量估计和Fourier变换估计对两个精算中具有零膨胀与过离散特点的理赔数据做了DCP分布拟合;2)我们证明了任意取0值概率大于0.5的离散分布均为伪离散复合Poisson分布,由此利用伪DCP分布的零膨胀性质和加虚拟频数的技巧,得到任意离散分布的拟合方法,并进行了离散K-S检验与卡方检验的对比;3)探讨了基于DCP分布的计数数据广义线性模型,用惩罚估计的方法来挑选重要回归变量。特别地,我们得到了负二项回归系数Elastic net估计值非零(为零)的充分必要条件(类似Karush-Kuhn-Tucker条件)。然后对狩猎蜘蛛计数数据分别实现了基于极大似然、Lasso惩罚、Elastic net惩罚的负二项回归,并进行了比较分析。4)阐述了由DCP分布特例衍生出的离散Frailty模型和治愈率模型(竞争因素的长期生存者分析模型)。5)展望了利用混合Poisson分布逼近离散分布的问题。由于混合系数选择的无穷维性和复杂性,混合分布的系数的估计成为高维问题。
【关键词】:无穷可分与复合Poisson 计数数据建模 广义线性模型 Stein-Chen方法 离散Kolmogorov-Smirnov检验 高维统计 零膨胀分布
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O211.3
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 引言10-14
  • 符号说明14-16
  • 第一章 预备知识16-33
  • 1.1 离散分布16-19
  • 1.2 离散分布的两个有力工具19-22
  • 1.2.1 母函数(生成函数)19-20
  • 1.2.2 FOURIER变换(特征函数)与WIENER-LEVY定理20-22
  • 1.3 无穷可分分布与LEVY-KHINCHINE公式22-24
  • 1.4 离散无穷可分分布与离散复合POISSSON分布24-25
  • 1.5 LASSO及其广义LASSO变量选择方法简述25-30
  • 1.6 BAYESIAN LASSO中的无穷可分先验分布30-33
  • 第二章 离散复合POISSON分布33-61
  • 2.1 POISSON分布模型33-35
  • 2.2 离散复合POISSON分布的模型35-41
  • 2.2.1 平稳性、独立增量性、稀有性35-36
  • 2.2.2 离散复合Poi sson分布(过程)的若干充要与充分条件36-41
  • 2.3 重要特例41-53
  • 2.3.1 HERMITE分布与广义HERMITE分布41
  • 2.3.2 POLYA-AEPPLI分布41-42
  • 2.3.3 NEYMAN A型分布42
  • 2.3.4 负二项分布42-43
  • 2.3.5 COM-负二项分布与广义COM-POISSON分布43-47
  • 2.3.6 百余种特例和子族47-53
  • 2.4 分布逼近53-61
  • 2.4.1 STEIN-CHEN方法逼近53-56
  • 2.4.2 算子半群法逼近56-59
  • 2.4.3 三角阵行和逼近59-61
  • 第三章 参数估计与数值计算61-74
  • 3.1 离散复合POISSON的累计量、原点矩和中心矩61-63
  • 3.2 累计量估计63-65
  • 3.3 参数的FOURIER变换估计65-66
  • 3.4 快速FOURIER变换算法计算概率质量函数66-69
  • 3.5 极大似然估计69-72
  • 3.6 拟合优度检验:卡方检验与K-S检验72-74
  • 第四章 相关计数数据模型74-98
  • 4.1 计数数据的拟合74-83
  • 4.1.1 过离散、零膨胀与伪离散复合POISSON74-77
  • 4.1.2 车险理赔数据拟合77-81
  • 4.1.3 任意离散分布的拟合81-83
  • 4.2 离散复合POISSON的广义线性模型83-92
  • 4.2.1 计数数据的广义线性模型83-85
  • 4.2.2 离散复合POISSON回归85-87
  • 4.2.3 基于惩罚函数的变量选择:以负二项回归为例87-92
  • 4.3 复合POISSON随机效应的生存分析模型92-97
  • 4.3.1 FRAILTY模型与非负复合POISSON分布92-95
  • 4.3.2 离散FRAILTY模型与竞争因素下的长期生存者模型95-97
  • 4.4 混合离散分布的变量选择问题97-98
  • 附录:离散复合POISSON分布概率质量函数P_n(t)的10种证明98-106
  • 参考文献106-117
  • 在校期间发表的论文117-118
  • 致谢118

【参考文献】

中国期刊全文数据库 前2条

1 李根;邹国华;张新雨;;高维模型选择方法综述[J];数理统计与管理;2012年04期

2 赵景义;李莉;刘桂芬;余红梅;;长期生存者资料统计分析方法研究进展[J];中国卫生统计;2010年03期


  本文关键词:无穷可分与复合Poisson律:相关计数数据模型、高维变量选择,由笔耕文化传播整理发布。



本文编号:472045

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/472045.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b906f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com