基于协同过滤与马尔可夫过程的高校图书推荐算法研究
发布时间:2020-05-21 15:30
【摘要】:图书馆是高校重点建设场所,每年都会引进大量的图书。如何在浩瀚的书海中帮助读者找到他们感兴趣的图书是一个亟待解决的问题。人工推荐和传统的图书搜索功能过于依赖过往的经验,并且这些经验无法被存储从而使更多的人受益。因此,在高校图书馆中建立个性化推荐系统有着重要的意义。相对于数字图书馆,目前国内高校图书馆个性化推荐系统还不成熟,主要原因有以下几点。首先是图书信息不充分,缺少内容、摘要等文本信息,无法通过主题模型或文本分析使用基于内容的推荐;其次,高校图书馆没有评分系统,无法获得读者的喜好程度,难以使用协同过滤的推荐;最后,鉴于学生的身份,高校读者急需一种能够提供与其专业相关并且具有知识结构上联系的图书推荐方式,但目前的推荐算法还没有相应的实现方案。为了解决上述问题,本文主要作出了以下贡献:(1)提出了一种基于兴趣度模型和类型因子的协同过滤推荐算法,该算法利用读者借阅行为数据建立兴趣度模型来近似读者评分,以此解决高校图书馆缺少评分系统的问题,并在此基础上使用中图类型因子解决借阅关系稀疏的问题。(2)深入分析高校学生读者的推荐需求,提出了孤点推荐的问题。该问题描述的是学生在不同学期借阅的图书之间应该有着知识结构上的联系和承接,而不是像一个个孤点一样。(3)针对孤点推荐问题,提出了一种基于马尔可夫过程的专业图书树推荐算法,该算法通过统计不同学期图书类型之间的关联度来得到转移概率矩阵,并通过首学期的初始类型向量乘以转移概率矩阵来得到各个学期推荐的图书。(4)利用本文提出的两种推荐算法,结合Hadoop分布式系统中的MapReduce计算框架,设计与实现了在现有借阅系统的历史数据之上的高校图书推荐系统。通过实验证明和实例分析,本文提出的两种高校图书推荐算法有一定的推荐效果,并且具有实际应用的价值,为高校图书推荐的研究提供了新的思路。
【图文】:
图 2-1 协同过滤推荐算法的分类基于模型的协同过滤常用的三种算法是基于关联规则的协同过滤,基于聚类的协同过滤和基于贝叶斯网络的协同过滤。基于内存的协同过滤推荐算法可细分为基于用户的协同过滤和基于项目的协同过滤。2.1.1 基于模型的协同过滤(1)基于关联规则的协同过滤该算法是利用关联规则算法来建立推荐模型,大致可以分为两个环节:第一,在一定的支持度阈值内,从存储与用户发生关系的项目数据库中查找频繁项集;第二,,依照确定的置信度,从频繁项集中发现关联规则。Aprior 算法[43][44]和 FP-Tree 算法[45]是常用的关联规则算法。关联规则可以在离线情况下运算得到,推荐时直接使用即可,保障了系统的实时性。并且,在用户没有提供评价信息的情况下,便能为用户推荐全新的兴趣点。其缺点
9图 2-2 基于用户的协同过滤推荐户都对 a,b,c 三样物品感兴趣。那么 X 和 Y 就可品 d 推荐给 Y。一步先通过用户历史行为寻找与目标用户最相似待推荐物品的评分进行加权平均后,预测出目标大小得到一个 top-N 的推荐列表。用户,m 个项目的推荐系统中,可以构建出一个 n度得到目标用户 u 的一个近邻用户集合 V。则目式计算得到: vVvivVuisimuvsimuvrr(,)(,)
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G258.6;TP391.3
本文编号:2674506
【图文】:
图 2-1 协同过滤推荐算法的分类基于模型的协同过滤常用的三种算法是基于关联规则的协同过滤,基于聚类的协同过滤和基于贝叶斯网络的协同过滤。基于内存的协同过滤推荐算法可细分为基于用户的协同过滤和基于项目的协同过滤。2.1.1 基于模型的协同过滤(1)基于关联规则的协同过滤该算法是利用关联规则算法来建立推荐模型,大致可以分为两个环节:第一,在一定的支持度阈值内,从存储与用户发生关系的项目数据库中查找频繁项集;第二,,依照确定的置信度,从频繁项集中发现关联规则。Aprior 算法[43][44]和 FP-Tree 算法[45]是常用的关联规则算法。关联规则可以在离线情况下运算得到,推荐时直接使用即可,保障了系统的实时性。并且,在用户没有提供评价信息的情况下,便能为用户推荐全新的兴趣点。其缺点
9图 2-2 基于用户的协同过滤推荐户都对 a,b,c 三样物品感兴趣。那么 X 和 Y 就可品 d 推荐给 Y。一步先通过用户历史行为寻找与目标用户最相似待推荐物品的评分进行加权平均后,预测出目标大小得到一个 top-N 的推荐列表。用户,m 个项目的推荐系统中,可以构建出一个 n度得到目标用户 u 的一个近邻用户集合 V。则目式计算得到: vVvivVuisimuvsimuvrr(,)(,)
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G258.6;TP391.3
【参考文献】
相关期刊论文 前10条
1 冷亚军;陆青;梁昌勇;;协同过滤推荐技术综述[J];模式识别与人工智能;2014年08期
2 李克潮;梁正友;;基于多特征的个性化图书推荐算法[J];计算机工程;2012年11期
3 董坤;;基于协同过滤算法的高校图书馆图书推荐系统研究[J];现代图书情报技术;2011年11期
4 刘维晓;陈俊丽;屈世富;万旺根;;一种改进的Apriori算法[J];计算机工程与应用;2011年11期
5 汪静;印鉴;;一种优化的Item-based协同过滤推荐算法[J];小型微型计算机系统;2010年12期
6 黄晓斌;张海娟;;国外数字图书馆推荐系统评述[J];情报理论与实践;2010年08期
7 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[J];计算机学报;2010年08期
8 武建伟;俞晓红;陈文清;;基于密度的动态协同过滤图书推荐算法[J];计算机应用研究;2010年08期
9 张忠平;郭献丽;;一种优化的基于项目评分预测的协同过滤推荐算法[J];计算机应用研究;2008年09期
10 李聪;梁昌勇;董珂;;基于项目类别相似性的协同过滤推荐算法[J];合肥工业大学学报(自然科学版);2008年03期
本文编号:2674506
本文链接:https://www.wllwen.com/tushudanganlunwen/2674506.html
教材专著