零膨胀CMP回归模型的变量选择
发布时间:2022-01-23 10:51
零膨胀计数模型已在社会经济、医疗、刑侦研究等诸多领域得以应用.零膨胀Conway-Maxwell-Poisson回归模型作为为常用的零膨胀计数模型之一可以很好的解决数据中出现的过离散与欠离散问题.变量选择方法可以对大规模纵向数据进行处理并从中提取出有用的信息进行统计分析以得到满意的结果,其中一类基于惩罚函数的变量选择方法受到了统计学者们的广泛关注.在已有文献中,对零膨胀CMP回归模型的变量选择方法研究不多.考虑到惩罚广义估计方程方法在变量选择等多方面富有准确度与高效性的便利,不需依赖复杂的联合似然函数计算,还能考虑到数据的组间相关性.因此将该方法应用到零膨胀CMP回归模型中,可以发挥更多有用的价值.根据零膨胀CMP回归模型中离散参数?会影响均值的特点,本文选择了改进的ES(Expectation-Solution)算法进行迭代,它包含EM(Expectation Maximization)算法与广义估计方程方法,优势是可以将不同参数有针对的区别对待来分析纵向数据.基于改进的ES算法,提出模型的变量选择方法-惩罚广义估计方程法,即在广义估计方程中加入满足大样本特性的SCAD惩罚函数,配合...
【文章来源】:辽宁师范大学辽宁省
【文章页数】:47 页
【学位级别】:硕士
【部分图文】:
不同参数值下CMP分布概率质量函数的变化图
零膨胀CMP回归模型的变量选择261)log(21)()1(log)(112)(1dnmVarpmNNBICnirtititkiti,2)log(21)())1((log)(1122dnyVaryyENNBICnirtitititi.其中inrN,d表示对应模型有效参数的数目,常使用非零参数(不包括截距)来预测d.BIC统计量的值越小,说明模型对实际数据的拟合效果越好.选择出使得BIC准则最小的调优参数就得出想要的最佳估计.(3)k-折交叉验证(k-foldCrossValidation,简称k-折CV)在文章中出现交叉验证方法来进行模型选择的论述最早是在Efron,Morris(1973)[59]中讨论的.事实上,交叉验证方法是一种样本数据分割法,通过重复循环使用样本,实现将样本数据利用率的最大化.利用大部分的样本来建立模型,再利用剩余小部分样本对已建立好的模型进行评估.具体的评估方法是:使用建好的模型对剩下样本进行预测,并选择出使残差平方和最小的模型作为最终的模型.交叉验证方法的假设条件比较宽松,只假设数据为相同分布,训练与测试样本为独立的,甚至能够再放松此假设条件.因此可以将交叉验证方法应用于几乎任何框架中的任意算法.与此相比大多数其他的选择过程都没有该普遍性的特质.此外还注意到,最佳的交叉验证风险评估并不必是最优的模型选择程序.由Breiman和Spector(1992)[60],留一法能够使模型得到最佳风险评估,10-折CV方法在模型选择的结果表现上更为准确.图3.110-折交叉验证示意图Fig.3.110-foldCrossValidation
【参考文献】:
期刊论文
[1]零膨胀损失次数的贝叶斯分位回归模型[J]. 杨亮,孟生旺. 数量经济技术经济研究. 2017(05)
[2]两类零膨胀负二项回归模型在汽车保险定价中的应用[J]. 徐昕,郭念国. 南阳师范学院学报. 2011(12)
本文编号:3604200
【文章来源】:辽宁师范大学辽宁省
【文章页数】:47 页
【学位级别】:硕士
【部分图文】:
不同参数值下CMP分布概率质量函数的变化图
零膨胀CMP回归模型的变量选择261)log(21)()1(log)(112)(1dnmVarpmNNBICnirtititkiti,2)log(21)())1((log)(1122dnyVaryyENNBICnirtitititi.其中inrN,d表示对应模型有效参数的数目,常使用非零参数(不包括截距)来预测d.BIC统计量的值越小,说明模型对实际数据的拟合效果越好.选择出使得BIC准则最小的调优参数就得出想要的最佳估计.(3)k-折交叉验证(k-foldCrossValidation,简称k-折CV)在文章中出现交叉验证方法来进行模型选择的论述最早是在Efron,Morris(1973)[59]中讨论的.事实上,交叉验证方法是一种样本数据分割法,通过重复循环使用样本,实现将样本数据利用率的最大化.利用大部分的样本来建立模型,再利用剩余小部分样本对已建立好的模型进行评估.具体的评估方法是:使用建好的模型对剩下样本进行预测,并选择出使残差平方和最小的模型作为最终的模型.交叉验证方法的假设条件比较宽松,只假设数据为相同分布,训练与测试样本为独立的,甚至能够再放松此假设条件.因此可以将交叉验证方法应用于几乎任何框架中的任意算法.与此相比大多数其他的选择过程都没有该普遍性的特质.此外还注意到,最佳的交叉验证风险评估并不必是最优的模型选择程序.由Breiman和Spector(1992)[60],留一法能够使模型得到最佳风险评估,10-折CV方法在模型选择的结果表现上更为准确.图3.110-折交叉验证示意图Fig.3.110-foldCrossValidation
【参考文献】:
期刊论文
[1]零膨胀损失次数的贝叶斯分位回归模型[J]. 杨亮,孟生旺. 数量经济技术经济研究. 2017(05)
[2]两类零膨胀负二项回归模型在汽车保险定价中的应用[J]. 徐昕,郭念国. 南阳师范学院学报. 2011(12)
本文编号:3604200
本文链接:https://www.wllwen.com/kejilunwen/yysx/3604200.html