当前位置:主页 > 科技论文 > 软件论文 >

单位名录库更新:互联网大数据源及其数据质量评估

发布时间:2019-05-27 13:41
【摘要】:在大数据时代,互联网数据资源的充分利用对提高政府统计能力的影响是不可忽视的,但互联网数据质量问题值得探讨。以单位名录库为研究对象,本文讨论了互联网数据作为单位名录库更新数据源的质量评估方法,从多维度视角比较分析了互联网数据源与传统数据源的数据质量;从准确性方面探讨了互联网数据源的数据质量评估框架,给出了单源质量评估、多源整合评估、事件信息辅助评估的做法和要点。分析结果表明,互联网数据源能够完成名录库"及时更新"的任务,可以辅助实现名录库更新的"真实准确"和"不重不漏",但不足以生成"统一完整"的名录库。同时,本文利用大众点评网、百度糯米网、地理信息系统等异源异构数据整合,给出了一个餐饮业名录库更新的数据质量评估实例。
[Abstract]:......
【作者单位】: 兰州财经大学统计学院;国家统计局统计科学研究所;兰州财经大学;
【基金】:国家自然科学基金项目“基于涵盖误差的我国周期性普查数据质量评估方法:理论与应用研究”(71301033) 国家社会科学基金青年项目“基于大数据整合的空气质量测度方法研究”(14CTJ009) 全国统计科研计划项目“基于普查涵盖误差测量技术的基本单位名录库维护与更新研究”(2011LX003) 陇原青年创新人才扶持计划项目“基于大数据整合的‘废旧数据’应用研究”(14GSD95) 甘肃省财政厅高校基本科研业务费项目“大数据整合下的统计调查技术及其经济应用研究”(GZ14007)资助
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 唐懿芳 ,牛力 ,张师超;多数据源挖掘中的模式合成技术[J];菏泽师专学报;2002年02期

2 蔡璇;田忠和;;多数据源查询的几种优化方法[J];计算机与数字工程;2006年07期

3 王颖;;分布式空间数据源的联合查询[J];计算机工程与设计;2007年04期

4 胡鹏昱;赵朋朋;方巍;崔志明;;深网数据源质量估计模型[J];计算机工程;2009年09期

5 孙宏旭;邢薇;马立和;;动态多数据源的研究与实现[J];电脑学习;2010年03期

6 邓松;万常选;刘喜平;廖国琼;;基于用户反馈的深网数据源选择[J];小型微型计算机系统;2012年11期

7 邓松;万常选;吁亮;刘德喜;雷刚;王映龙;;非合作结构化深网数据源摘要的动态更新[J];微电子学与计算机;2014年04期

8 陈彤兵,胡金化,汪保友,施伯乐;分布式自治数据源的联合查询[J];计算机研究与发展;2004年04期

9 庞东升;;信息化过程中的数据源管理[J];中国高校科技与产业化(学术版);2006年S3期

10 黄克颖;高s,

本文编号:2486196


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2486196.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a534***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com