当前位置:主页 > 管理论文 > 统计学论文 >

数据挖掘在统计工作中的应用研究

发布时间:2020-05-27 23:52
【摘要】: 论文从理论论证和实例研究两方面展开,试图通过对相关问题的深入研究,探索数据挖掘技术运用于政府统计的主要过程和一般分析方法。 经过多年的积累,当前政府统计工作面临“数据丰富,但信息贫乏”的问题,且忽视了对历史数据中隐性规律的挖掘分析,然而将基于数据仓库的数据挖掘技术运用于政府统计能够很好的解决这一问题。本文通过对统计数据特点的分析,提出了统计数据仓库建设的原则,并据此提出了基于数据仓库与数据挖掘技术的统计分析系统的实现架构、构建了便于进行分析的统计多维数据模型,并把它们应用于实证分析。在实证分析阶段,将关联及聚类算法应用于决策树算法分析的基础之上,算法的结合很好的保证了所分析指标的相关性及有效性。
【图文】:

逻辑结构图,农村经济,哈尔滨,逻辑结构


图 4-2 哈尔滨县(市)农村经济主题的星(座)型逻辑结构二、物理模型的构建物理模型设计解决的是关系模型的实现细节问题。在得到逻辑模型后,就可以着手进行对应的物理模型设计了。物理模型设计阶段,详细的定义每一个字段的类型及表之间的关系。表 4-1 至表 4-5 所示的是根据以上的逻辑模型所构造出的相应的物理模型。表 4-1 事实表:fact 农村经济与收入列名 数据类型 允许空时间 ID Nvarchar(255) N地点 ID Nvarchar(255) N指标 ID Nvarchar(255) N农民人均纯收入(元) Float Y

评估图,决策树,准确性


在模型评估阶段,不仅要利用工具来评估模型的精确性,,还必须与统计业务人员讨论所发现模式的意义。有时模型不包括有用的模式,这可能是由几个原因引起的:首先,数据是完全随机的;其次,模型中一组变量不是最适合的,可能需要反复地执行数据清理和转换步骤,以便派生出更有意义的变量。数据挖掘是一个循环的过程,通常要经过几次循环才能找到适合的模型。图 4-3 显示的是以上十个模型的挖掘准确性比较:
【学位授予单位】:黑龙江大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:C81

【引证文献】

相关硕士学位论文 前2条

1 石萌;数据挖掘在医疗保险参保人员老龄化问题中的应用研究[D];贵州财经学院;2010年

2 何玮;杭州市经济普查数据库系统设计与实现[D];浙江工业大学;2012年



本文编号:2684346

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2684346.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户78946***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com