当前位置:主页 > 管理论文 > 统计学论文 >

大样本线性混合效应模型的子抽样方法及其应用研究

发布时间:2020-07-13 17:48
【摘要】:科学技术在过去十年的迅速发展带来了非常多的数据,一个主要挑战是计算资源的进步仍然远远落后于数据集的指数级增长。处理大规模数据集的一个普遍方法是子抽样。例如,在线性回归模型中利用经验的统计杠杆得分作为重要性抽样分布,能提高计算最小二乘估计的效率。本文考虑对面板数据构造新的杠杆抽样方法,然后应用于混合效应模型中,并通过随机模拟来研究新方法的优良性质。本文主要考虑大样本情形下一类混合效应模型的子抽样,混合效应模型的一类所谓误差分量回归模型中,对每个个体会有重复观测,当个体数规模很大时,重复观测更加剧了数据的规模,所以在该模型下提出了使用子抽样算法降低计算复杂度。首先根据面板数据具有组内相关性的性质,构造了一种成组数据杠杆得分权重确定方法,然后利用其作为子样本的抽样概率。进一步,我们将新方法和均匀抽样方法进行了随机模拟比较研究,将抽样方法应用于多元正态分布,自由度为1的T分布,自由度为3的T分布中并验证了新方法的有效性。杠杆抽样是在子抽样框架下进行设计,其中从全部数据中抽取一小部分数据(子样本),然后使用子样本替代全样本执行预期的计算。对于用不同方法抽出来的面板数据进行混合效应模型的不同参数估计,包括均匀抽样估计(UNIF),杠杆抽样估计(LEV),不加权杠杆抽样估计(LEVUW)。杠杆方法利用杠杆得分构造非均匀抽样概率,能够得到可解释性的子抽样方法。最后对抽样估算方法进行偏差及方差的对比分析,并给出不同子抽样方法的应用范围。
【学位授予单位】:北方工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C81
【图文】:

方差,分布数据,抽样方法,偏差


图5-2邋N=1000,邋k=3时P的偏差对比逡逑图5-2为分别是对多元正态分布分布数据(GA),自由度为3的多元T分逡逑布分布数据(T3)和自由度为1的多元T分布数据(T1)采取同样的三种抽样逡逑方法之后进行混合效应模型的拟合,同样分别重复抽取1000次,然后计算参数逡逑(3的偏差的平方。从图中我们可以发现,第一,P的偏差的平方不论在哪种数据逡逑分布中,都随着样本量的增大而减少。而且采用LEVUW抽样方法抽取的样本逡逑估计的卩的偏差最小,因为LEVUNW抽样方法相对于全样本加权估计的(3近似逡逑22逡逑

分布数据,抽样数量,多元正态分布,自由度


逦抽样数量逦抽样数量逡逑图5-1邋N=1000,k=3时P的方差对比逡逑GA逦T3逦T1逡逑10-逦10-逦10-逡逑抽样分类逦抽样分类逦*逦抽样分类逡逑?LEV逦-逦LEV逦-逦LEV逡逑‘邋LEVUW逦*邋LEVUW逦?逦-邋LEVUW逡逑-UNIF逦*邋UNIF逦:邋?逦-邋UNIF逡逑兹邋5?‘逦^邋5*逦5-邋t邋'邋.、、逡逑fK.逦i逦"><逦'逦?*-逦…秦逦....逡逑5逦\逦^逦^逦\逡逑

本文编号:2753783

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2753783.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户651f7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com