当前位置:主页 > 社科论文 > 社会学论文 >

大数据背景下政府统计数据分析及预测研究

发布时间:2018-08-28 13:30
【摘要】:近年来,在网络经济学、环境科学、互联网技术等许多领域都产生了数据的大规模增长现象,社会正式进入大数据时代。大数据作为一种信息资本和数据资源将对国家治理、政府决策等方面产生巨大影响。这也使得许多传统的数据处理及分析算法不能满足数据急速增长的需求。文中主要对大数据背景下政府统计方法进行分析研究,具体工作安排如下。第一章论述了本文的研究背景、意义和国内外文献综述,提出了本文的研究问题。第二章介绍 Bootstrap算法与 Bootstrap 的改进算法 Bag of Little Bootstrap(简称BLB算法),给出算法的具体思想和计算过程,指出BLB算法在数据量庞大的情况下具有较高的可行性。第三章针对传统的核算方法在权数上更新速度较慢以及大数据背景下数据量庞大的问题,从核算流程及权数等方面对CPI核算方法进行了改进,提出了基于Bootstrap的抽样方法,从而扩大了数据的样本量,降低了价格采集点的采集频率,在节省数据采集成本的同时,也提高了预测精度;参考统计网络价格消费指数的方法,对CPI核算中的权数做了改进,提高了权数更新的频率。第四章构建了基于Bootstrap和BLB抽样方法的回归预测模型,并给出了相应算法。所给模型较好地体现了 Bootstrap和BLB抽样方法在统计数据处理和推断中的优点。特别是,基于BLB抽样方法的回归预测方法能够在数据量较大的情况下实现分块并行运算,从而使得该模型能够更好地适合大数据回归分析。第五章对第四章所提到的回归预测模型做了实证分析,通过实验验证了Bootstrap回归算法相对于传统的多元线性回归模型具有更高的预测精确度;将BLB回归模型应用到CPI的预测中,进一步验证了 BLB回归模型相较于Bootstrap回归模型具有更高的精确度。第六章对论文的主要内容做了总结,并就CPI核算和回归预测方面提出了进一步研究的问题。
[Abstract]:In recent years, large-scale growth of data has occurred in many fields, such as network economics, environmental science, Internet technology and so on. The society has formally entered the era of big data. The analysis algorithm can not meet the demand of the rapid growth of data. This paper mainly analyzes and studies the government statistical methods under the background of large data. The specific work arrangement is as follows. The first chapter discusses the research background, significance and literature review at home and abroad, and puts forward the research problems of this paper. The second chapter introduces the Bootstrap algorithm and Bootstrap. The improved algorithm Bag of Little Bootstrap (BLB algorithm for short) is presented. The specific idea and calculation process of the algorithm are given. It is pointed out that the BLB algorithm has high feasibility in the case of large amount of data. The method of sampling based on Bootstrap is put forward, which enlarges the sample size of data, reduces the collection frequency of price collection points, saves the cost of data acquisition, and improves the prediction precision. Referring to the method of statistical network price consumption index, the weight of CPI calculation is increased. In the fourth chapter, a regression prediction model based on Bootstrap and BLB sampling method is constructed, and the corresponding algorithm is given. The model presented in this paper reflects the advantages of Bootstrap and BLB sampling methods in statistical data processing and inference. In the fifth chapter, the regression prediction model mentioned in the fourth chapter is empirically analyzed, and the experimental results show that the Bootstrap regression algorithm has higher prediction than the traditional multiple linear regression model. The BLB regression model is applied to the prediction of CPI, which further verifies that the BLB regression model has higher accuracy than the Bootstrap regression model.
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:C812

【参考文献】

相关期刊论文 前10条

1 田涛;;电商发展对CPI的影响研究——基于大数据背景下线上线下价格波动的同步性分析[J];上海经济研究;2016年03期

2 于施洋;王建冬;童楠楠;;大数据环境下的政府信息服务创新:研究现状与发展对策[J];电子政务;2016年01期

3 张洋;;大数据背景下CPI短期预测[J];中国统计;2015年12期

4 王薇;胡晓丹;;“大数据”在CPI调查中的应用初探——人工采集网络购买商品价格的研究及建议[J];中国统计;2015年12期

5 孙丹丹;;CPI权重计算新方法探究[J];中国市场;2015年43期

6 张艳;;刍议大数据背景下CPI统计改革取向[J];中国统计;2015年06期

7 陈梦根;刘浩;;大数据对CPI统计的影响及方法改进研究[J];统计与信息论坛;2015年06期

8 李晓欣;;大数据时代我国CPI调查与编制问题研究[J];价格理论与实践;2014年10期

9 张伟;朱孔来;;权数对CPI的结果影响程度定量分析[J];统计与信息论坛;2014年06期

10 张明康;;大数据应用于政府统计的探索与实践——基于财税数据应用的研究[J];调研世界;2014年03期

相关重要报纸文章 前1条

1 李世超;;利用大数据改革CPI调查方法初探[N];中国信息报;2013年

相关硕士学位论文 前3条

1 孔威;时间序列分析在CPI中的应用研究[D];延边大学;2014年

2 徐朝;基于Bootstrap的ARCH类模型的参数估计及其算法[D];武汉理工大学;2009年

3 曾,

本文编号:2209529


资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/2209529.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b7eb4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com