图书信息的改进艾普莱数据挖掘方法研究与实现
发布时间:2021-04-18 07:58
随着电子图书馆在世界范围内大行其道,它已经成为人们从图书馆获取知识信息的一种主要手段。从其发展速度来看,电子图书馆在相当程度取代纸质图书馆,已经成为难以遏制的必然发展趋势。但这并不是说电子图书馆就没有任何问题,其中存储的海量信息,就给用户如何在短时间内搜索到自己的适用资源增添了不少麻烦。为了有效解决这一问题,人们在电子图书馆信息管理系统的设计过程中,开始关注数据挖掘算法的设计。本文以数据挖掘算法为基础,设计了图书馆信息系统。首先,针对电子图书馆中数据挖掘前的数据预处理工作进行了相关方法的设计,主要是依托于K-Means均值聚类方法的设计。之后,对电子图书馆中两类最重要的数据信息,用户信息和图书信息进行了聚类分析,并进行了相关验证性实验。其次,对数据挖掘领域中的艾普莱算法进行了详细的分析,包括方法的操作过程以及其中存在的问题。针对其主要问题进行改进,提出了改进艾普莱方法,在改进艾普莱方法中,通过配置计数和地址集合设定,大大降低了剪枝处理的难度,提升了算法在图书馆系统中信息挖掘的效率。最后,在前面的聚类分析和数据挖掘方法设计的基础上,对图书馆信息系统进行详细的设计并完成聚类分析和数据挖掘的...
【文章来源】:哈尔滨理工大学黑龙江省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
用户信息的聚类分析流程设计
图 2-2 用户信息相关的三类卡片据之前选定的能够表征用户特点的下载频次进行分类,可以的用户分类三个类别,超频率使用型、中频率使用型、低频过对 100 条用户信息的梳理,使用电子图书馆的三个类别的用致如下:表 2-1 电子图书馆用户三个类别的聚类分析结果类别 记录 年均下载频次 总平均下率使用型 256 15 4率使用型 542 31 13率使用型 202 62 26分用户的聚类分析结果如表 2-2 所示。表 2-2 电子图书馆的部分用户的聚类分析结果号 姓名 年均下载频次 总均下载频次 0309 韦纪州 9 41 低频0155 宋洋 32 122 中频
哈尔滨理工大学工程硕士学位论文0711 吴兵兵 59 258 超频率0326 张雪林 32 108 中频率0608 肖强 11 51 低频率0326 沈鹏飞 59 277 超频率0107 张亚为 42 125 中频率0229 李翔 8 44 低频率图书信息的 K-Means 聚类子图书馆的信息管理系统中,除了用户信息以外,图书信息在千差万别的海量电子图书资源中,哪些电子图书更受用户的响到电子图书馆的后期运营和维护。所以,一类图书的被下载反应该书是不是用户喜爱的热点图书的关键。在本文电子图书设计当中,与图书信息相关的三类卡片的设计结果,如图 2-3
【参考文献】:
期刊论文
[1]对数据流频繁项集挖掘算法WSW-Imp的改进[J]. 王晓霞,王治和. 计算机工程与应用. 2013(08)
[2]数据挖掘取样方法研究[J]. 胡文瑜,孙志挥,吴英杰. 计算机研究与发展. 2011(01)
[3]我国公共图书馆服务体系建设:治理模式研究[J]. 梁欣. 中国图书馆学报. 2009(06)
[4]从知识运动的角度认识图书馆[J]. 周慧. 中国图书馆学报. 2009(06)
[5]解决数据样本不平衡性的频繁子图挖掘算法[J]. 谢玓,尚学群,王淼,张延园. 计算机工程与应用. 2008(36)
[6]WEB使用挖掘研究[J]. 黄浩,王建军. 计算机系统应用. 2008(01)
[7]数据挖掘在数字图书馆中的应用研究[J]. 潘旭武,陈玲洪. 浙江高校图书情报工作. 2007(01)
[8]关联规则挖掘的常用算法及其比较分析[J]. 涂承胜. 重庆三峡学院学报. 2006(03)
[9]基于数据挖掘的数字图书馆个性化服务[J]. 夏南强,张红梅. 图书馆学研究. 2006(01)
[10]数据挖掘技术在图书馆工作中的应用[J]. 黄兰. 图书馆学研究. 2005(07)
博士论文
[1]基于粗糙集的指标体系构建及综合评价方法研究[D]. 李远远.武汉理工大学 2009
硕士论文
[1]基于数据仓库的学生就业管理系统的研究[D]. 金雪峤.电子科技大学 2010
[2]可视化数据挖掘技术的研究与实现[D]. 施惠娟.华东师范大学 2010
[3]数据挖掘技术在数字化校园中的应用[D]. 邹晶晶.中南大学 2009
[4]基于粗糙集的属性约简与规则提取[D]. 黄丽萍.厦门大学 2007
本文编号:3145120
【文章来源】:哈尔滨理工大学黑龙江省
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
用户信息的聚类分析流程设计
图 2-2 用户信息相关的三类卡片据之前选定的能够表征用户特点的下载频次进行分类,可以的用户分类三个类别,超频率使用型、中频率使用型、低频过对 100 条用户信息的梳理,使用电子图书馆的三个类别的用致如下:表 2-1 电子图书馆用户三个类别的聚类分析结果类别 记录 年均下载频次 总平均下率使用型 256 15 4率使用型 542 31 13率使用型 202 62 26分用户的聚类分析结果如表 2-2 所示。表 2-2 电子图书馆的部分用户的聚类分析结果号 姓名 年均下载频次 总均下载频次 0309 韦纪州 9 41 低频0155 宋洋 32 122 中频
哈尔滨理工大学工程硕士学位论文0711 吴兵兵 59 258 超频率0326 张雪林 32 108 中频率0608 肖强 11 51 低频率0326 沈鹏飞 59 277 超频率0107 张亚为 42 125 中频率0229 李翔 8 44 低频率图书信息的 K-Means 聚类子图书馆的信息管理系统中,除了用户信息以外,图书信息在千差万别的海量电子图书资源中,哪些电子图书更受用户的响到电子图书馆的后期运营和维护。所以,一类图书的被下载反应该书是不是用户喜爱的热点图书的关键。在本文电子图书设计当中,与图书信息相关的三类卡片的设计结果,如图 2-3
【参考文献】:
期刊论文
[1]对数据流频繁项集挖掘算法WSW-Imp的改进[J]. 王晓霞,王治和. 计算机工程与应用. 2013(08)
[2]数据挖掘取样方法研究[J]. 胡文瑜,孙志挥,吴英杰. 计算机研究与发展. 2011(01)
[3]我国公共图书馆服务体系建设:治理模式研究[J]. 梁欣. 中国图书馆学报. 2009(06)
[4]从知识运动的角度认识图书馆[J]. 周慧. 中国图书馆学报. 2009(06)
[5]解决数据样本不平衡性的频繁子图挖掘算法[J]. 谢玓,尚学群,王淼,张延园. 计算机工程与应用. 2008(36)
[6]WEB使用挖掘研究[J]. 黄浩,王建军. 计算机系统应用. 2008(01)
[7]数据挖掘在数字图书馆中的应用研究[J]. 潘旭武,陈玲洪. 浙江高校图书情报工作. 2007(01)
[8]关联规则挖掘的常用算法及其比较分析[J]. 涂承胜. 重庆三峡学院学报. 2006(03)
[9]基于数据挖掘的数字图书馆个性化服务[J]. 夏南强,张红梅. 图书馆学研究. 2006(01)
[10]数据挖掘技术在图书馆工作中的应用[J]. 黄兰. 图书馆学研究. 2005(07)
博士论文
[1]基于粗糙集的指标体系构建及综合评价方法研究[D]. 李远远.武汉理工大学 2009
硕士论文
[1]基于数据仓库的学生就业管理系统的研究[D]. 金雪峤.电子科技大学 2010
[2]可视化数据挖掘技术的研究与实现[D]. 施惠娟.华东师范大学 2010
[3]数据挖掘技术在数字化校园中的应用[D]. 邹晶晶.中南大学 2009
[4]基于粗糙集的属性约简与规则提取[D]. 黄丽萍.厦门大学 2007
本文编号:3145120
本文链接:https://www.wllwen.com/tushudanganlunwen/3145120.html