当前位置:主页 > 社科论文 > 社会学论文 >

“碎片化数据”的模型平均方法

发布时间:2018-01-19 06:25

  本文关键词: 碎片化数据 线性模型 异方差 刀切法模型平均 最优权重 出处:《华东师范大学》2016年硕士论文 论文类型:学位论文


【摘要】:随着“大数据”时代的来临,越来越多的数据获得渠道给科学研究及其实际应用带来了巨大的机遇。但另一方面,由于每个样本可以获得的数据渠道不尽相同,我们面临的可能是一种“碎片化”的数据,这给统计建模带来了很大的挑战。在这篇文章里,我们提出一种基于模型平均的方法来处理“碎片化数据”。不同于传统统计方法依赖于单一的模型,模型平均方法可以根据数据的可获得情况拟合多个模型,然后通过加权平均来获得最终的估计。我们在可获得完整数据的那部分样本上采用刀切法来获得加权的权重并严格证明了该权重选择方法的最优性。我们做了大量的数值模拟来验证所提出的方法在有限样本上的优异表现。同时我们通过一个实例分析展现了我们方法的实际应用。
[Abstract]:With the advent of "big data" era, more and more channels of data acquisition have brought great opportunities for scientific research and its practical application. On the other hand, because of the different data channels each sample can obtain. We may face a "fragmentation" of data, which poses a great challenge to statistical modeling, in this article. We propose a method based on model averaging to deal with "fragmentation data". Different from the traditional statistical method which relies on a single model, the model averaging method can fit multiple models according to the availability of data. Then we get the final estimate by weighted average. We use the knife cutting method to obtain the weighted weight in the sample where the complete data can be obtained, and prove strictly the optimality of the weight selection method. The numerical simulation of the proposed method is used to verify the performance of the proposed method on a finite sample. At the same time, we demonstrate the practical application of our method by an example analysis.
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:C81

【相似文献】

相关期刊论文 前10条

1 李根;邹国华;张新雨;;高维模型选择方法综述[J];数理统计与管理;2012年04期

2 柴振荣;管理策略[J];管理科学文摘;1994年08期

3 张维群;多目标抽样调查的模型选择[J];统计与信息论坛;1999年04期

4 韩珂;尹勤;;大学生手机话费模型的建立和分析[J];统计教育;2007年09期

5 陶长琪;杨海文;;空间计量模型选择及其模拟分析[J];统计研究;2014年08期

6 杨东升;截面时序分析——模型选择与参数估计[J];统计研究;1999年01期

7 向阳,杨德礼;模型选择Agent研究[J];管理科学学报;2004年02期

8 唐年胜;邱世芳;;非线性再生散度模型的Bayes估计[J];数理统计与管理;2007年06期

9 闫荣国;邱长溶;;马尔可夫域变模型在我国季度GDP增长率序列建模中的应用[J];数理统计与管理;2007年02期

10 张新雨;邹国华;;模型平均方法及其在预测中的应用[J];统计研究;2011年06期

相关会议论文 前9条

1 张维;;模型选择:现状与发展[A];全国青年管理科学与系统科学论文集(第1卷)[C];1991年

2 金伟;周浩;于永利;;维修管理IDSS的设计方法[A];设备维修与改造技术论文集[C];2000年

3 曾菊英;许冰;;制度变迁及其模型选择[A];21世纪数量经济学(第10卷)[C];2009年

4 廖冬初;秦寿康;;县级规划总体优化模型及其计算方法[A];发展战略与系统工程——第五届系统工程学会年会论文集[C];1986年

5 张维;;关于模型选择中的若干理论问题[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年

6 战明华;李生校;;货币与产出的关系(1995~2003):不同模型的分析结果及其比较[A];中国金融学会第八届优秀论文评选获奖论文集[C];2005年

7 王树盛;;Probit模型及其在交通方式分担中的应用研究[A];可持续发展的中国交通——2005全国博士生学术论坛(交通运输工程学科)论文集(下册)[C];2005年

8 戴锋;梁玲;李兴兵;冯俊涛;;经济增长的动态进程模型及实证研究[A];第十四届中国管理科学学术年会论文集(上册)[C];2012年

9 韩珂;尹勤;;大学生手机话费模型的建立和分析[A];江苏省现场统计研究会第十次学术年会论文集[C];2006年

相关重要报纸文章 前3条

1 建南;帮你建立有效客户关系[N];中国商报;2001年

2 首创期货研发中心金融工程组 徐泽平;方差-协方差法的VaR计量模型选择[N];期货日报;2007年

3 证券时报记者 杨波 金烨 程俊琳;量化投资走在中国 六年学步渐入佳境[N];证券时报;2010年

相关博士学位论文 前8条

1 夏小超;统计检验与模型选择相关问题研究[D];重庆大学;2015年

2 朱素玲;模型选择与模型平均研究[D];兰州大学;2014年

3 吕子昂;模型选择的曲率方法研究[D];北京交通大学;2012年

4 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年

5 贺利坚;多Agent系统中信任和信誉模型的研究[D];北京交通大学;2011年

6 张立明;结合可满足的基于模型等价性验证及不一致诊断问题研究[D];吉林大学;2012年

7 毛文涛;支持向量回归机模型选择研究及在综合力学环境预示中的应用[D];西安交通大学;2011年

8 刘靖旭;支持向量回归的模型选择及应用研究[D];国防科学技术大学;2006年

相关硕士学位论文 前10条

1 张亚楠;基于宏微观模型推断钢构件强度的无损检测技术研究[D];中国矿业大学;2015年

2 单昕彤;认知诊断中模型—资料的测验拟合检验统计量研究[D];江西师范大学;2015年

3 井海银;超高维可加模型下的特征筛选[D];重庆大学;2015年

4 江婷婷;基于修正负二项分布的索赔次数模型研究[D];重庆大学;2015年

5 孙志滨;LDA模型的研究及其在推荐系统中的应用[D];浙江大学;2016年

6 仝景景;“碎片化数据”的模型平均方法[D];华东师范大学;2016年

7 张钊;基于无偏估计方程的模型选择[D];山东经济学院;2011年

8 朱小岩;基于分段函数的剂量—反应模型的参数估计和模型选择[D];东北师范大学;2005年

9 徐桂彬;基于相关主题模型的音乐分类方法研究[D];苏州大学;2012年

10 张佶炜;基于中国数据的随机死亡率模型比较研究[D];华东师范大学;2014年



本文编号:1443050

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/1443050.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户57d20***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com