当前位置:主页 > 管理论文 > 统计学论文 >

大规模数据下基于充分降维的Leverage重要性抽样方法

发布时间:2021-02-21 08:40
  随着信息技术的飞速发展,大规模数据在短时间内搜集并储存下来,为分析决策提供了巨大的信息量,也给统计建模带来了一定难度。对于样本容量大、变量个数少的数据,Leverage重要性抽样是一个简便可行的方法。本文发现,该方法中度量样本重要性的Leverage分数与因变量无关,而且在维度较大的情形下对样本没有区分程度,使得估计结果较差。为了同时考虑因变量和维度的影响,本文提出了基于充分降维的Leverage重要性抽样方法。该方法以不损失信息为前提,在充分降维的空间内重新计算Leverage分数,使得抽样更具有代表性。模拟数据分析显示,在样本容量较大的复杂数据中,相比于原始的Leverage重要性抽样方法,本文提出的方法可以降低估计的均方误差。三个实际数据也证实了该方法的可行性和有效性。 

【文章来源】:统计研究. 2020,37(03)北大核心CSSCI

【文章页数】:15 页


本文编号:3044112

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3044112.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f879a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com