基于MM算法的纵向数据双惩罚分位模型研究
发布时间:2020-05-15 00:33
【摘要】:纵向数据是金融、医学和生物等领域的重要数据类型,一直都是现代统计学研究的前沿和热点问题。现如今,分位数回归模型已被广泛地应用到纵向数据的建模与分析中。但在高维数据下,对于纵向数据的分位数回归模型的研究工作目前还不多见。本文基于含随机效应的简单线性随机截距模型,提出了纵向数据的双正则化分位数回归模型,即在模型的损失函数中同时对固定效应和随机效应同实施L_1正则化惩罚即Lasso,并且基于贝叶斯推断的原理,证明了在假设待估参数的先验分布为条件Laplace分布时,双L_1正则化分位数回归模型待估参数的解可以看作是其一个后验众数解。在模型求解方法上,考虑到传统求解分位数回归模型算法的局限性,提出了MM算法和交替迭代算法相结合的算法。首先给定随机效应参数的初始值,然后基于MM算法的思想找到损失函数的优化函数,再使用高斯-牛顿迭代法对优化函数求解固定效应的参数值。接着基于得到的固定效应参数估计值再去随机效应参数的估计值,如此迭代进行,直到达到阈值停止迭代。该算法大大提高了模型的运算效率及稳定性。在正则化参数的选取上,基于SIC准则,采用十折交叉验证来选取正则化参数,进一步提高了模型预测的准确度,并证明了该方法的渐近性质。考虑到在实际情况下,有时候个体效应不仅影响模型的截距项,也有可能影响模型的斜率。其次,Lasso惩罚法虽然能对模型中的重要预测变量做出选择,但它估计出来的变量参数是有偏的。所以,在双正则化分位数回归模型的理论基础上,本文接着改进模型,将其推广至含多重随机效应的情形之下,将双正则化分位数回归模型的参数解作为新模型损失函数惩罚项的权重,提出了纵向数据的双自适应Lasso惩罚分位数回归模型,并给出了其贝叶斯解释。模型求解算法和正则化参数的选取同双正则化分位数回归模型一致。然后,通过数值模拟结果,得出:基于MM算法的双正则化分位数回归模型和双自适应Lasso惩罚分位数回归模型得到的参数估计结果优于内点算法得到的参数估计结果,而且MM算法不受迭代初值的影响,样本量越大,模型拟合效果越好。最后,本文选用美国艾滋病医疗试验机构ACTG发布的一组非平衡测量的数据来分别建立普通线性分位数回归模型、双正则化分位数回归模型和双自适应Lasso惩罚分位数回归模型,并对比分析三个模型的效果,结果发现,双自适应Lasso惩罚分位数回归模型由于进一步考虑到双L_1正则化分位数回归模型的局限性,模型的稳定性和预测精度都在其之上。通过观察双惩罚分位数回归模型的估计结果,我们发现对于艾滋病的治疗,年龄、疗法、测量时间均是影响疗效的显著变量,且变量间存在交互关系,所以建议不同年龄的患者应该采用不同的疗法,并且不同的疗法要制定不同的测量时间。
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O212.1;F224
本文编号:2664168
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O212.1;F224
【参考文献】
中国期刊全文数据库 前10条
1 刘涛;;复合分位回归的MM算法及其在非寿险中的应用[J];信息系统工程;2017年11期
2 罗幼喜;李翰芳;;基于双自适应Lasso惩罚的随机效应分位回归模型研究[J];数量经济技术经济研究;2017年05期
3 王娜;任燕燕;;面板数据分位数回归模型求解的模式搜索法[J];数理统计与管理;2016年03期
4 刘晓倩;周勇;;加权复合分位数回归方法在动态VaR风险度量中的应用[J];中国管理科学;2015年06期
5 姜云卢;袁晶晶;;基于MM-算法的局部常数核加权分位数回归估计及应用[J];华南师范大学学报(自然科学版);2013年04期
6 罗幼喜;李翰芳;田茂再;;基于Gibbs抽样算法的面板数据分位回归方法[J];统计研究;2011年07期
7 罗幼喜;田茂再;;面板数据的分位回归方法及其模拟研究[J];统计研究;2010年10期
8 朱慧明;王彦红;曾惠芳;;基于逆跳MCMC的贝叶斯分位自回归模型研究[J];统计与信息论坛;2010年01期
9 ;Hierarchical linear regression models for conditional quantiles[J];Science in China(Series A:Mathematics);2006年12期
10 李育安;;分位数回归及应用简介[J];统计与信息论坛;2006年03期
,本文编号:2664168
本文链接:https://www.wllwen.com/kejilunwen/yysx/2664168.html