中国经济普查的数据挖掘方法研究
发布时间:2017-03-19 00:02
本文关键词:中国经济普查的数据挖掘方法研究,由笔耕文化传播整理发布。
【摘要】: 第一次全国经济普查是我国经济发展进入21世纪后进行的一项重大国情国力调查,是党中央、国务院为正确认识国情、准确把握国力、科学制定国策而采取的一项重要举措。只有通过经济普查,才能比较准确地把握中国经济变化的规律和趋势,正确制定经济政策和社会经济发展规划,进一步控制经济增长,提高经济发展速度,促进经济和社会协调发展,推动可持续发展战略的实施。在这次经济普查中,从国民经济行业分类的具体构成来看,涉及到19个大的行业归类,875个行业小类。可以说这次经济普查提供的数据是非常完整的。面对普查之后的海量数据存储,国家更需要有力的数据分析工具以及方法将丰富的数据转换成有价值的知识,否则大量的数据将成为数据丰富,但信息贫乏的“数据坟墓”。 数据挖掘技术正是从大型数据库或数据仓库中提取有潜在应用价值的信息或模式,旨在帮助人们从海量数据中发现有价值的信息。如何从历史数据中及时发现有用的知识,从而挖掘出其潜在的价值,提高其利用率,是信息处理技术研究领域的一项重要课题。 本论文把视角放在中国经济普查的数据挖掘的方法研究上去,,所以论文研究的主要内容是借助一般数据挖掘和数据仓库理论以及相关回归等理论,探索出符合中国经济普查的数据挖掘技术的方法。论文全面阐述第一次全国经济普查统计分类标准与数据表的审核关系以及数据处理方案,建立经济普查数据仓库及算法的选择,并以SQL工具对经济普查数据挖掘系统进行具体实现与运行,并提出维护好数据挖掘系统的建议。
【关键词】:经济普查 数据挖掘 数据仓库
【学位授予单位】:东北林业大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:F222
【目录】:
- 摘要3-4
- Abstract4-8
- 1 绪论8-18
- 1.1 研究背景及问题的提出8-9
- 1.2 研究的目的和意义9-11
- 1.2.1 研究的目的9
- 1.2.2 研究的意义9-11
- 1.3 国内外研究现状11-15
- 1.3.1 国内外数据挖掘技术研究现状11-13
- 1.3.2 国内外数据挖掘技术应用现状13-14
- 1.3.3 国内外经济普查实践与数据开发现状14-15
- 1.4 研究的思路和方法15-16
- 1.5 研究内容16
- 1.6 技术路线16
- 1.7 本章小结16-18
- 2 相关理论基础及概念界定18-32
- 2.1 数据挖掘理论18-24
- 2.1.1 知识发现中的数据挖掘18-19
- 2.1.2 数据挖掘的内涵19
- 2.1.3 数据挖掘的基本技术19-20
- 2.1.4 数据挖掘概念与其他概念的区分20-22
- 2.1.5 Analysis Services数据分析工具22-23
- 2.1.6 SQL Server数据仓库环境23-24
- 2.2 数据仓库理论24-26
- 2.2.1 数据仓库的定义24
- 2.2.2 数据仓库的主要特征24
- 2.2.3 联机分析处理24-25
- 2.2.4 数据仓库与 OLAP解决方案25-26
- 2.3 相关回归理论26-31
- 2.3.1 相关分析26-28
- 2.3.2 回归分析28-30
- 2.3.3 多变量数据分析30-31
- 2.3.4 多元回归分析与数据挖掘31
- 2.4 本章小结31-32
- 3 第一次全国经济普查的实施与基础数据32-39
- 3.1 第一次全国经济普查目的及意义32
- 3.2 第一次全国经济普查调查对象及方法32-33
- 3.3 统计分类标准与经济普查统计指标解释33-34
- 3.3.1 统计分类标准33-34
- 3.3.2 第一次全国经济普查统计指标解释34
- 3.4 第一次全国经济普查数据处理工作方案34-35
- 3.5 中国经济普查基础数据资料35-38
- 3.6 普查数据质量情况38
- 3.7 本章小结38-39
- 4 经济普查数据挖掘仓库的构建与算法选择39-46
- 4.1 一般经济普查数据库分析39
- 4.2 经济普查数据挖掘仓库的要求39-40
- 4.3 经济普查数据挖掘仓库的构建40-43
- 4.3.1 确定挖掘对象40-41
- 4.3.2 数据准备41
- 4.3.3 经济普查数据挖掘仓库的数据组织方式41
- 4.3.4 数据预处理41-42
- 4.3.5 数据抽取42
- 4.3.6 数据转换42-43
- 4.3.7 数据净化43
- 4.3.8 数据汇总43
- 4.4 数据挖掘算法的选择43-45
- 4.4.1 采用决策树算法的原因44
- 4.4.2 决策树的表示形式44-45
- 4.4.3 创建微软决策树45
- 4.5 本章小结45-46
- 5 经济普查数据挖掘系统实现46-54
- 5.1 经济普查数据挖掘系统的实现过程46-51
- 5.1.1 目标确定46
- 5.1.2 注册服务器46
- 5.1.3 建立数据仓库46-47
- 5.1.4 创建表和索引47-48
- 5.1.5 创建数据源并链接48-49
- 5.1.6 创建挖掘模型以及算法选择49-51
- 5.2 系统的测试与运行51-52
- 5.3 系统的更新和维护52-53
- 5.4 本章小结53-54
- 结论54-55
- 参考文献55-58
- 攻读学位期间发表的学术论文58-59
- 致谢59-60
【参考文献】
中国期刊全文数据库 前10条
1 高韬,谢昆青,马修军,陈冠华;SDML:基于空间数据库的空间数据挖掘语言[J];北京大学学报(自然科学版);2004年03期
2 郝先臣,张德干,高光来,赵海;数据挖掘工具和应用中的问题[J];东北大学学报;2001年02期
3 刘海虹,刘伯莹;数据挖掘技术[J];丹东纺专学报;2001年01期
4 杨城;数据挖掘的实施分析[J];电脑开发与应用;2002年11期
5 刘斌,卢增祥,瞿艳,冯翱,路海明;Bookmark——智能化网络信息服务系统[J];高技术通讯;1999年06期
6 杨会志;数据挖掘技术的主要方法及其发展方向[J];河北科技大学学报;2000年03期
7 许宪春;关于经济普查年度GDP核算方案的思考[J];经济科学;2005年04期
8 恽爽,胡南军,董浚,陈道蓄;数据挖掘软件现状研究[J];计算机工程与应用;2003年08期
9 易敏昕,汪胜,张有仁,陈宝树;Web使用数据挖掘中数据预处理的研究[J];计算机工程与应用;2003年24期
10 汤效琴,戴汝源,徐琪;数据挖掘中变量聚类方法的应用研究[J];计算机工程与应用;2004年24期
中国硕士学位论文全文数据库 前1条
1 梁伟;Web使用挖掘在电子商务推荐系统中的应用研究[D];天津大学;2004年
本文关键词:中国经济普查的数据挖掘方法研究,由笔耕文化传播整理发布。
本文编号:255203
本文链接:https://www.wllwen.com/jingjilunwen/jjtj/255203.html