基于偏拉普拉斯分布的若干分位数回归模型的统计推断
本文关键词:基于偏拉普拉斯分布的若干分位数回归模型的统计推断
更多相关文章: 偏拉普拉斯分布 分位数回归 非迭代抽样 逆贝叶斯公式 随机EM算法 混合分位数回归 变点模型
【摘要】:自Koenker and Bassett(1978)以来,分位数回归模型已成为探索因变量与自变量之间关系的重要工具。由于能够同时考察因变量对自变量在多个分位数水平上的依赖关系,分位数回归比均值回归或中位数回归能够提供更全面的信息,也更加稳健,该回归模型已在各个领域有了广泛的应用和发展。本文旨在研究基于偏拉普拉斯分布的若干分位数回归模型的参数估计问题,这些模型包括分位数回归、截尾分位数回归、有限混合分位数回归以及带有变点的中位数回归模型。涉及若干统计算法,包括非迭代抽样算法、随机EM算法、以及有限混合模型的Gibbs抽样算法等。所考虑算法能避免传统算法的有关缺点,并在模拟和实例分析中都有较好的表现。1.分位数回归模型的非迭代抽样算法考虑如下线性分位数回归模型(?)其中yi为响应变量,xi为p×1协变量,βq为p维感兴趣的未知参数向量,εi为随机误差项,要求其q阶分位数为零。于是,给定xi,βq为yi的q阶条件分位数回归系数。βq的分位数估计使下式达最小(?)(?)(?)其中ρq(u)=u{q-I(u0)}为损失函数,这里I(·)表示示性函数。下面引入偏拉普拉斯分布ALD(0,σ,q),其密度函数为(?)(?)由于最小化S(βq)等价于最大化以ALD(0,σ,q)为误差分布的线性回归模型的似然函数,所以ALD(0,σ,q)通常用来刻画分位数回归中误差项εi的分布。近年来,基于ALD(0,σ,q)误差假设及其位置尺度混合表示,关于分位数回归模型的统计推断方法有了讯速发展,如 Reed and Yu(2009)以及 Kozumi and Kobayashi(2011)的 Gibbs抽样算法,Tian et al.(2014)和 Zhou et al.(2014)的 EM 算法。在贝叶斯框架下,Yu and Stander(2007)研究了 tobit分位数回归模型的统计推断,Benoit and Van den Poel(2012)则发展了二值分位数回归模型的推断方法。尽管EM算法是在缺失结构下寻找最大似然估计(MLE)或后验众数的有力工具,对于这种基于似然的推断方法依然有很多挑战,比如Meng and Rubin(1991)提到的多参数下估计的标准误问题,讨厌参数问题,中小样本下MLE的渐进理论未必适用问题等。由于其灵活性和易实施性,Gibbs抽样和其他马氏链蒙特卡洛方法(MCMC)被广泛用于贝叶斯统计推断,但这些迭代抽样算法有其缺陷,实际应用中容易被忽视。其一,由迭代的MCMC抽样产生的样本很难做到独立;其二,很难确信迭代终止时抽取的马氏链是否达到收敛。Tan et al.(2003)提出了一种缺失数据结构下基于逆贝叶斯公式(IBF)的非迭代抽样算法,该算法可从后验分布中产生(近似)独立同分布(i.i.d.)的样本,该样本可直接用于贝叶斯统计推断,从而该方法避免了 EM算法和Gibbs抽样的缺点。受Tanet al.(2003)启发,在第一章中,我们将IBF的思想应用到分位数回归模型中去,发展了相应的非迭代后验抽样算法。首先,将ALD表示为正态分布的方差-均值混合,其中混合变量服从指数分布,将该变量视为潜变量,获得添加的后验预测分布。然后,用EM算法所得后验众数作为初始估计获得最佳的重点抽样密度(ISD)。最后,将IBF算法与抽样/重点再抽样(SIR)算法结合起来,产生来自观测后验分布的近似独立同分布的样本。数值模拟和实例分析显示,该非迭代算法比EM算法和迭代的Gibbs抽样表现要好。2.截尾分位数回归模型的随机EM算法在第二章,我们发展了处理分位数回归及截尾分位数回归模型的随机EM算法,该算法能避免EM算法和Gibbs抽样的一些缺点。模拟结果显示,该算法不逊于Gibbs抽样,而在非缺失的情形下,优于EM算法。最后,我们用该算法分析了经典的Engel食物消费数据和带截尾的劳动力供应数据,发现与Gibbs抽样相比,SEM算法的表现更令人满意。3.有限混合分位数回归模型的Gibbs抽样算法在回归分析里,有限混合线性回归模型已被广泛用来刻画混在一起的不同组别中因变量度对自变量的依赖关系。但通常对不同组内的误差作正态性假设,该假设对重尾数据或数据中的异常值很敏感。与混合线性(正态)回归相比,混合分位数回归模型更加稳健,且通过研究不同分位数下不同组别中因变量与因变量的相依关系,该模型能够更加全面地描述自变量对因变量的影响。文献中,最早处理混合分位数回归模型的是Wu and Yao(2016),在他们的文章中,作者提出了一种半参数混合分位数回归模型,对误差项未作任何假设,发展了一种基于核密度估计的半参数EMI算法来估计参数。随后,Tian et al.(2016)考虑了基于偏拉普拉斯误差假设的混合分位数回归模型,并发展了易于实施的EM算法。尽管EM算法是处理缺失数据结构,获得最大似然估计(MLE)或后验众数的有力工具,但求所得估计的标准误却并非易事,特别是在多参数的场合。当样本量很大时,基于最大似然估计的渐进正态性,一般可用观测的信息阵的逆矩阵的对角元的平方根来估计该标准误,但对于中等或很小的样本量来说,该渐进理论未必合适。受Tian et al.(2016)启发,在论文第三章里,我们从贝叶斯的角度探讨了有限混合分位数回归模型的统计推断问题。利用ALD的分层表示以及多项分布的分组变量,在很弱的先验设定下,我们导出了 Gibbs抽样中所到用的满条件分布。该Gibbs抽样策略的每一步都很清楚,且易于实施。与EM算法相比,该算法的优势是可以利用Gibbs样本对参数做统计推断并评价其标准差。模拟显示,在不同的数据生成机制和分位数水平下,该算法所得估计有相对很小的偏差和均方误差。最后,我们用该策略分析了两组实际数据,发现与混合正态(均值)回归相比,该策略对数据中的异常值很稳健,同时能够更全面系统地描述不同组别中因变量对协变量的依赖关系。4.基于拉普拉斯回归模型的稳健变点估计在第四章中,我们提出了基于拉普拉斯回归的稳健回归系数变点模型,并借助拉普拉斯分布的正态混合表示,发展了估计变点位置的EM算法和Schwarz信息准则(SIC)。模拟发现该方法对误差分布很稳健,能够有效地估计变点位置。最后,我们有分析了一组股票市场数据,并发现了一个潜在的变点。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:O212.1
【相似文献】
中国期刊全文数据库 前10条
1 李育安;;分位数回归及应用简介[J];统计与信息论坛;2006年03期
2 张代强;张屹山;;前瞻性利率规则在我国的实证研究——基于分位数回归方法的变参数检验[J];数量经济技术经济研究;2008年10期
3 刘生龙;;教育和经验对中国居民收入的影响——基于分位数回归和审查分位数回归的实证研究[J];数量经济技术经济研究;2008年04期
4 胡永远;倪丽艳;;基于分位数回归的社会救助再就业人群收入研究[J];山东财政学院学报;2013年03期
5 陈建宝;丁军军;;分位数回归技术综述[J];统计与信息论坛;2008年03期
6 解栋栋;;服务业发展与人均收入的关系:基于分位数回归的实证研究[J];当代财经;2009年08期
7 卢荻千;;基于分位数回归的净资产收益率研究——来自2008年我国上市公司的财务数据[J];金融经济;2009年20期
8 张珏;;基于分位数回归模型的证券市场风险研究[J];统计与决策;2011年09期
9 林德钦;;基于分位数回归的我国居民边际消费倾向动态研究[J];新余学院学报;2011年03期
10 王珍;高民芳;;基于分位数回归的资本结构影响因素研究[J];中国集体经济;2011年25期
中国重要会议论文全文数据库 前6条
1 林艺圃;;中国股市价量关系的实证分析分位数回归模型[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
2 陈娟;林龙;叶阿忠;;基于分位数回归的中国居民消费研究[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
3 夏宁;;中国上市公司高管人员薪酬的影响因素与成因分解——一个基于分位数回归模型的实证研究[A];中国会计学会财务管理专业委员会2009年学术年会论文集[C];2009年
4 宋马林;吴杰;高玉强;张琳玲;宋峰;;中国入世以来的对外贸易与环保效率——基于分省面板数据的实证分析[A];中国贸易救济与产业安全论丛(2012)——第七届中国贸易救济与产业安全研究奖获奖论文集[C];2013年
5 任声策;;创新和出口的互动关系:基于中国制造业企业的实证[A];第八届(2013)中国管理学年会——技术与创新管理分会场论文集[C];2013年
6 刘鑫波;张志敏;梁逸曾;;高效准确的高分辨数据快速平滑与基线校正算法[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
中国博士学位论文全文数据库 前9条
1 康宁;分位数回归模型及在金融经济中的应用[D];合肥工业大学;2016年
2 刘惠篮;基于复合分位数回归方法的统计模型的相关研究[D];重庆大学;2016年
3 Muhammad Amin;高维惩罚分位数回归建模及其应用[D];大连理工大学;2015年
4 杨丰凯;基于偏拉普拉斯分布的若干分位数回归模型的统计推断[D];山东大学;2017年
5 王娜;面板数据分位数回归模型求解及应用研究[D];山东大学;2017年
6 韩月丽;极值统计与分位数回归理论及其应用[D];天津大学;2009年
7 关静;分位数回归理论及其应用[D];天津大学;2009年
8 项云帆;资本资产定价模型及实证分析[D];华中科技大学;2010年
9 陈林兴;基于空间视角的我国省际农村居民消费趋同性研究[D];浙江大学;2012年
中国硕士学位论文全文数据库 前10条
1 代贝;基于分位数回归的农村居民消费区域差异研究[D];昆明理工大学;2015年
2 罗小青;基于分位数回归的中国GDP与电力消费量关系研究[D];华南理工大学;2015年
3 于琴;西部地区农村产权抵押贷款对农户收入的影响研究[D];西北农林科技大学;2015年
4 王欢欢;绩效评估角度的信息化升级时间域选择模型[D];首都经济贸易大学;2015年
5 刘袁;利率市场化背景下商业银行利率风险的测度[D];南京财经大学;2015年
6 周策;VaR模型在我国开放式上市基金市场的实证分析[D];广东外语外贸大学;2015年
7 耿国强;分位数回归理论及其在金融时间序列的应用[D];中国矿业大学;2015年
8 王琪锋;复合分位数回归在线性时间序列下的应用[D];大连理工大学;2015年
9 吴博闻;删失数据下部分线性变系数模型的分位数回归[D];大连理工大学;2015年
10 凌珂;生长曲线模型的分位数回归与变量选择[D];华东师范大学;2015年
,本文编号:1281354
本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/1281354.html