数据挖掘技术在档案信息管理中的应用研究
本文选题:档案管理 + 数据仓库 ; 参考:《天津大学》2016年硕士论文
【摘要】:数据挖掘是指从大量数据中通过算法搜索隐藏于其中知识的过程,作为一种知识发现技术它已经在很多数据密集型行业得到广泛应用。档案是指人们在各项社会活动中直接形成的各种形式的具有保存价值的原始记录,在我国档案界多年的计算机管理中形成了大量的电子数据,但这些数据的利用还比较初级,只是基于数据库层面的查询、统计、分析等。针对这种局面,本文尝试将数据仓库和数据挖掘技术应用于档案信息管理工作,通过分析档案利用数据库和档案归档数据库,揭示档案与利用者之间、档案与各归档单位之间以及档案之间的关系,从而在更深层次上发挥档案数据在新时代的信息价值。文章主要从档案数据仓库设计、数据ETL、多维数据模型的建立、数据挖掘算法选择、数据挖掘模型应用等方面论述了将数据挖掘技术与档案工作相结合的具体实践,实现了档案数据挖掘的基本过程。首先对构建数据仓库进行详细的需求分析,确定主题和用户,根据已有的档案业务数据库确定数据仓库的维度表和事实表,并最终采用星型模式创建档案数据仓库;然后通过数据ETL将档案原始数据源经过抽取、转换,加载进入数据仓库,这个过程主要是对档案数据进行预处理和清理工作;接着再利用OLAP工具对档案多维数据集进行多角度和多视图的查询,以更好的理解档案数据;最后在档案数据仓库的基础上,根据数据挖掘的需求分析,利用SQL Server Analysis Services工具并选取合适的数据挖掘算法对档案数据进行分析处理,并对结果进行分析。全文的核心为研究数据挖掘技术在档案信息管理中的应用实践。
[Abstract]:Data mining refers to the process of searching hidden knowledge from a large amount of data by algorithm. As a knowledge discovery technology, it has been widely used in many data-intensive industries. Archives refer to various forms of original records with preservation value which are directly formed by people in various social activities. A large number of electronic data have been formed in the computer management of archival circles in China for many years, but the utilization of these data is still relatively primary. Only based on database level query, statistics, analysis and so on. In view of this situation, this paper tries to apply data warehouse and data mining technology to archives information management, through analyzing archives use database and archival archiving database, reveals the relationship between archives and users. The relationship between archives and archival units and between archives, thus exerting the information value of archival data in the new era on a deeper level. This paper mainly discusses the concrete practice of combining data mining technology with archival work from the aspects of file data warehouse design, data ETL, multidimensional data model establishment, data mining algorithm selection, data mining model application and so on. The basic process of file data mining is realized. Firstly, the requirement of constructing data warehouse is analyzed in detail, the subject and user are determined, the dimension table and fact table of data warehouse are determined according to the existing archival business database, and finally the file data warehouse is created by star pattern. Then the original data source is extracted, converted and loaded into the data warehouse by ETL. The process is mainly to preprocess and clean the file data. Then we use the OLAP tool to query the multi-angle and multi-view of the archive cube in order to better understand the archival data. Finally, on the basis of the archival data warehouse, according to the needs of data mining analysis, Using SQL Server Analysis Services tools and selecting appropriate data mining algorithm to analyze and process the file data, and analyze the results. The core of this paper is to study the application of data mining technology in archives information management.
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G270.7;TP311.13
【相似文献】
相关期刊论文 前10条
1 吴少敏,冯建生;数据挖掘技术及其应用[J];冶金自动化;2001年06期
2 黎洪生,卓祯雨;数据挖掘技术及其在过程监控中的应用[J];广东自动化与信息工程;2002年03期
3 黎洪生,卓祯雨;数据挖掘技术及其在过程监控中的应用[J];计算技术与自动化;2002年04期
4 何志国,曹玉东;数据挖掘技术[J];攀枝花学院学报;2002年06期
5 贺玉珍;浅析数据挖掘技术[J];运城高等专科学校学报;2002年03期
6 庞先伟;基于数据挖掘技术的资源型学习[J];现代远程教育研究;2002年03期
7 卢辉斌,王拥军;数据挖掘技术在入侵检测中的应用[J];燕山大学学报;2003年02期
8 张丽丽;数据挖掘技术的应用分析[J];山西经济管理干部学院学报;2003年04期
9 张红军;谈谈数据挖掘技术及其应用[J];广西梧州师范高等专科学校学报;2003年03期
10 田小霞,刘晓霞;数据挖掘技术在客户保持中的应用研究[J];微计算机应用;2003年03期
相关会议论文 前10条
1 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
2 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 宁红梅;安志兴;葛亚明;李敬玺;赵坤;钟华;陈俊杰;崔艳红;;数据挖掘技术在兽医学中的应用[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年
4 王桂芹;黄道;;数据挖掘技术综述[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 徐宝莲;李晓奇;;数据挖掘技术在网络游戏中的应用[A];第十一届中国不确定系统年会、第十五届中国青年信息与管理学者大会论文集[C];2013年
6 胡广芹;陆小左;;数据挖掘技术在中医诊断中的应用[A];中国中西医结合学会诊断专业委员会2009’年会论文集[C];2009年
7 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
8 铁军;吴智明;;数据挖掘技术在工业铝电解生产中的应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 王建华;王菲;黄国建;;数据挖掘技术研究的现状及展望[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
10 肖健华;吴今培;;数据挖掘技术及其应用实例[A];2001年中国智能自动化会议论文集(下册)[C];2001年
相关重要报纸文章 前10条
1 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
2 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
3 梅静彦;数据挖掘技术在美国银行的应用[N];金融时报;2006年
4 邹广普;数据挖掘技术在保险业中的应用[N];中国保险报;2010年
5 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
6 张崇峰;挖掘,,再挖掘[N];中国计算机报;2003年
7 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
8 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
9 刘军 兰小红 龚富强;新技术为老装备“保驾护航”[N];大众科技报;2006年
10 本报记者 于 岫;建设数据仓库 打造信息时代的“航母”[N];中国国门时报;2005年
相关博士学位论文 前10条
1 沈忱;基于贝叶斯网络数据挖掘技术研究《本草纲目》活血化瘀类中药性—效—用关系[D];南京中医药大学;2015年
2 钱力维;胡国俊祛邪助运治疗老年病学术思想和经验总结[D];南京中医药大学;2016年
3 姚山;基于数据挖掘技术的造林决策研究[D];北京林业大学;2008年
4 曹秀英;基于粗集的数据挖掘技术及其应用研究[D];哈尔滨工程大学;2003年
5 伍平阳;基于数据挖掘技术的医疗设备绩效预测方法的应用研究[D];南方医科大学;2008年
6 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
7 王勇;时序数据挖掘技术及其在水质预测中的应用研究[D];广东工业大学;2005年
8 熊忠阳;面向商业智能的并行数据挖掘技术及应用研究[D];重庆大学;2004年
9 朱恒民;领域知识制导的数据挖掘技术及其在中药提取中的应用[D];南京航空航天大学;2006年
10 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
相关硕士学位论文 前10条
1 刘洋;数据挖掘技术在档案信息管理中的应用研究[D];天津大学;2016年
2 肖建国;数据挖掘技术在就业指导与本科教学改革工作中的应用研究[D];吉林大学;2008年
3 钱和平;基于改进的灰色理论数据挖掘技术的研究[D];内蒙古农业大学;2010年
4 安冬冬;基于数据挖掘技术的常规公交服务水平评价体系研究[D];西南交通大学;2015年
5 陈萍;数据挖掘技术在网络教学中的应用研究[D];广东技术师范学院;2015年
6 邓博;基于数据挖掘技术构建电信4G客户预测模型的研究[D];兰州大学;2015年
7 赵明芳;数据挖掘技术在教学评教中的应用与研究[D];宁夏大学;2015年
8 苗家铭;基于数据挖掘技术的商业银行个人信用风险评估模型及其应用[D];南京财经大学;2015年
9 鲍素贞;数据挖掘技术在个性化网络教学平台中的应用研究[D];聊城大学;2015年
10 李文栋;基于Spark的大数据挖掘技术的研究与实现[D];山东大学;2015年
本文编号:2034809
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2034809.html