纵向数据部分线性模型基于二次推断函数的复合分位数回归估计
发布时间:2021-10-07 07:06
纵向数据是指对同一个体在不同时间或空间上进行重复观测而得到的数据,包含时间序列数据和截面数据,能够充分反应数据之间的复杂关系。部分线性模型综合了参数和非参数模型的优点,具有较强的灵活性、适应性和对数据的解释能力,因而被广泛应用于纵向数据建模中。在对纵向数据的部分线性模型进行统计推断时,当模型随机误差不满足假设条件或数据分布存在异常,现存的很多估计方法缺乏稳健性,且未考虑纵向数据的组内相关关系。因此本文基于二次推断函数对该模型利用复合分位数回归方法进行估计。该估计方法结合多处分位点的分位数回归,得到的估计结果更为稳健;且该估计方法利用二次推断函数引入工作相关矩阵,能够有效的处理纵向数据个体内部的相关关系。本文在一定的条件下证明了该估计的渐近正态性,进一步给出了平滑估计算法。最后通过数值模拟研究估计的有限样本性质并应用于实例中。
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
检查函数ρτ(u)示意图
§3.4数值模拟表3-4随机误差服从MN时回归系数估计Bias,SD和MSEModelCQRQIFQRQIFWorkingRnBiasSDMSEBiasSDMSEAR(1)500.005790.129850.067710.007730.141170.081361000.003140.107310.040560.004010.119340.043271500.001510.079810.02751-0.002830.101620.03709CS500.006170.131680.073620.006190.143600.085011000.003510.114020.045370.005210.127010.04525150-0.001950.087140.02540-0.002150.090730.03024基于上述估计结果,我们可以得到:1.随着样本量n的增加,CQRQIF估计的偏差,标准差和均方误差都逐渐变小,表明估计量的精度随着样本的增大而提高,估计结果具有一致性;且当CQRQIF在工作相关矩阵不一定正确指定时,其估计的偏差,标准差和均方误差仍能得到稳定的结果;2.通过对比不同随机误差分布下的模拟结果,当随机误差服从正态分布时,CQRQIF和QRQIF方法的估计结果相近,当随机误差不再服从正态分布时,特别是在随机误差服从t(3)分布时,CQRQIF方法得到的估计结果略优于其他方法得到的估计结果;且在三种分布下CQRQIF方法的估计结果较为稳定,CQRQIF对于随机误差分布依赖性较弱,估计结果具有稳健性.三、不同工作相关矩阵R对非参数m(t)估计的影响为了在随机误差服从正态分布情况下比较不同的工作相关矩阵对于非参数估计的影响,设ei~N(0,σ2R(ρ)),令σ2=1,n=100,R(ρ)采用AR(1)和CS两种结构,且不同的工作相关矩阵的相关系数均为ρ=0.5,其曲线m(t)=cos(2πt)拟合结果由下图3-1和3-2,其中图中的实线表示真实曲线,虚线表示本文方法的拟合结果.从拟合曲线来看,基于二次推断函数的复合分位数回归估计在不同的工作相关矩阵下也有较好的估计.图3-1残差结构为AR(1)时的拟合图-23-
第三章部分线性模型基于QIF的复合分位数回归估计图3-2残差结构为CS时的拟合图§3.5性质证明本节给出上述定理和命题的证明,首先定义G0(θ)=(g01(θ)T,...,g0v(θ)T)T,其中g0l(θ)=gl(θ0)Γnl(θθ0)则G0(θ)=G(θ0)Γn(θθ0),Q0n(θ)={G0(θ)}T(0n)1G0(θ).为了给出证明,需要给出以下一些引理.引理3.5.1.(VanderVaart(2000):Lemma19.24)假设F是P-Donsker类的可测函数,GF是具有零均值和协方差的高斯过程,fn是F中的随机函数序列,该函数序列满足:对于某些f0∈L2(P),∫(fn(x)f0(x))2dP(x)依概率收敛于0.则有Gn(fnf0)→p0,因此有Gn(fn)Gp(f0).引理3.5.2.定义集合Θn(C)={θ:∥θθ0∥2=C/√n},其中C为足够大的常数.则在集合Θn(C)上,有supθ∈Θn(C)∥G(θ)G0(θ)∥2=op(1/√n),(3-6)supθ∈Θn(C)|Qn(θ)Q0n(θ)|=op(1/n).(3-7)证明证明过程中我们仅需要考虑G(θ)G0(θ)的组成部分gl(θ)g0l(θ).构造δ=1nKn∑i=1K∑k=1WTikMli[ψτk(yiWikθ)ψτk(e0k){F(b0k)F(Wik(θθ0)+b0k)}],η=1nKn∑i=1K∑k=1WTikMli[φikWik(θθ0)+{F(b0k)F(Wik(θθ0)+b0k)}],-24-
【参考文献】:
期刊论文
[1]面板数据分位数回归模型的诱导光滑估计[J]. 袁晓惠,司贺,王纯杰. 统计与决策. 2018(11)
[2]纵向数据分位回归模型的降维算法模拟研究[J]. 罗幼喜,李翰芳. 统计与决策. 2018(09)
[3]部分线性单指标模型的复合分位数回归及变量选择[J]. 吕亚召,张日权,赵为华,刘吉彩. 中国科学:数学. 2014(12)
[4]纵向数据半参数模型的二次推断函数估计[J]. 赵明涛,许晓丽. 统计与决策. 2014(07)
[5]纵向数据非参数模型的二次推断函数估计[J]. 赵明涛,何晓群. 统计与决策. 2013(07)
[6]基于Gibbs抽样算法的面板数据分位回归方法[J]. 罗幼喜,李翰芳,田茂再. 统计研究. 2011(07)
[7]半参数回归模型小波估计的强逼近[J]. 钱伟民,柴根象. 中国科学(A辑). 1999(03)
[8]一类半参数回归模型的估计理论[J]. 洪圣岩. 中国科学(A辑 数学 物理学 天文学 技术科学). 1991(12)
硕士论文
[1]复合分位数回归在线性时间序列下的应用[D]. 王琪锋.大连理工大学 2015
本文编号:3421582
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
检查函数ρτ(u)示意图
§3.4数值模拟表3-4随机误差服从MN时回归系数估计Bias,SD和MSEModelCQRQIFQRQIFWorkingRnBiasSDMSEBiasSDMSEAR(1)500.005790.129850.067710.007730.141170.081361000.003140.107310.040560.004010.119340.043271500.001510.079810.02751-0.002830.101620.03709CS500.006170.131680.073620.006190.143600.085011000.003510.114020.045370.005210.127010.04525150-0.001950.087140.02540-0.002150.090730.03024基于上述估计结果,我们可以得到:1.随着样本量n的增加,CQRQIF估计的偏差,标准差和均方误差都逐渐变小,表明估计量的精度随着样本的增大而提高,估计结果具有一致性;且当CQRQIF在工作相关矩阵不一定正确指定时,其估计的偏差,标准差和均方误差仍能得到稳定的结果;2.通过对比不同随机误差分布下的模拟结果,当随机误差服从正态分布时,CQRQIF和QRQIF方法的估计结果相近,当随机误差不再服从正态分布时,特别是在随机误差服从t(3)分布时,CQRQIF方法得到的估计结果略优于其他方法得到的估计结果;且在三种分布下CQRQIF方法的估计结果较为稳定,CQRQIF对于随机误差分布依赖性较弱,估计结果具有稳健性.三、不同工作相关矩阵R对非参数m(t)估计的影响为了在随机误差服从正态分布情况下比较不同的工作相关矩阵对于非参数估计的影响,设ei~N(0,σ2R(ρ)),令σ2=1,n=100,R(ρ)采用AR(1)和CS两种结构,且不同的工作相关矩阵的相关系数均为ρ=0.5,其曲线m(t)=cos(2πt)拟合结果由下图3-1和3-2,其中图中的实线表示真实曲线,虚线表示本文方法的拟合结果.从拟合曲线来看,基于二次推断函数的复合分位数回归估计在不同的工作相关矩阵下也有较好的估计.图3-1残差结构为AR(1)时的拟合图-23-
第三章部分线性模型基于QIF的复合分位数回归估计图3-2残差结构为CS时的拟合图§3.5性质证明本节给出上述定理和命题的证明,首先定义G0(θ)=(g01(θ)T,...,g0v(θ)T)T,其中g0l(θ)=gl(θ0)Γnl(θθ0)则G0(θ)=G(θ0)Γn(θθ0),Q0n(θ)={G0(θ)}T(0n)1G0(θ).为了给出证明,需要给出以下一些引理.引理3.5.1.(VanderVaart(2000):Lemma19.24)假设F是P-Donsker类的可测函数,GF是具有零均值和协方差的高斯过程,fn是F中的随机函数序列,该函数序列满足:对于某些f0∈L2(P),∫(fn(x)f0(x))2dP(x)依概率收敛于0.则有Gn(fnf0)→p0,因此有Gn(fn)Gp(f0).引理3.5.2.定义集合Θn(C)={θ:∥θθ0∥2=C/√n},其中C为足够大的常数.则在集合Θn(C)上,有supθ∈Θn(C)∥G(θ)G0(θ)∥2=op(1/√n),(3-6)supθ∈Θn(C)|Qn(θ)Q0n(θ)|=op(1/n).(3-7)证明证明过程中我们仅需要考虑G(θ)G0(θ)的组成部分gl(θ)g0l(θ).构造δ=1nKn∑i=1K∑k=1WTikMli[ψτk(yiWikθ)ψτk(e0k){F(b0k)F(Wik(θθ0)+b0k)}],η=1nKn∑i=1K∑k=1WTikMli[φikWik(θθ0)+{F(b0k)F(Wik(θθ0)+b0k)}],-24-
【参考文献】:
期刊论文
[1]面板数据分位数回归模型的诱导光滑估计[J]. 袁晓惠,司贺,王纯杰. 统计与决策. 2018(11)
[2]纵向数据分位回归模型的降维算法模拟研究[J]. 罗幼喜,李翰芳. 统计与决策. 2018(09)
[3]部分线性单指标模型的复合分位数回归及变量选择[J]. 吕亚召,张日权,赵为华,刘吉彩. 中国科学:数学. 2014(12)
[4]纵向数据半参数模型的二次推断函数估计[J]. 赵明涛,许晓丽. 统计与决策. 2014(07)
[5]纵向数据非参数模型的二次推断函数估计[J]. 赵明涛,何晓群. 统计与决策. 2013(07)
[6]基于Gibbs抽样算法的面板数据分位回归方法[J]. 罗幼喜,李翰芳,田茂再. 统计研究. 2011(07)
[7]半参数回归模型小波估计的强逼近[J]. 钱伟民,柴根象. 中国科学(A辑). 1999(03)
[8]一类半参数回归模型的估计理论[J]. 洪圣岩. 中国科学(A辑 数学 物理学 天文学 技术科学). 1991(12)
硕士论文
[1]复合分位数回归在线性时间序列下的应用[D]. 王琪锋.大连理工大学 2015
本文编号:3421582
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3421582.html