基于Mahout的个性化图书推荐系统设计与实现

发布时间:2021-01-23 06:24
  推荐系统作为辅助用户选择、发掘用户需求迅速得到了相关研究者和互联网市场的关注,同时个性化推荐服务也被广泛应用到各个领域。本论文以分布式存储和计算平台Hadoop为系统基础运行环境,使用Mahout的协同过滤算法和Top-10算法为推荐算法核心。实现了基于Mahout的个性化图书推荐系统。本论文的主要工作如下:1.对目前主流的推荐算法如基于协同过滤推荐、基于内容的推荐和混合型推荐相关原理和应用场景进行了分析和研究。结合本系统的特点和算法应用的广泛性。选出了适合本系统的推荐算法。2.使用JavaWeb技术搭建个性化图书推荐平台网站。本系统采用的是Java开发中常用的SSH框架和MySQL开发,实现后台、前台和数据库进行数据交互。3.依据系统的特性推荐算法选择了基于协同过滤推荐和基于Top-10的推荐。这两种分别用于对的单个用户的个性化推荐和大众用户的Top-10热门推荐,后者也用于新用户的冷启动问题。4.设计并实现了以Hadoop为底层的基于Mahout框架的个性化图书推荐系统。 

【文章来源】:西北民族大学甘肃省

【文章页数】:56 页

【学位级别】:硕士

【部分图文】:

基于Mahout的个性化图书推荐系统设计与实现


HDFS架构图

组件图,协同过滤,原理图,推荐算法


图 2-3 Taste 工作原理组件图。2.3 推荐算法介绍随着互联网的迅速发展带动着如淘宝、今日头条、当当网等非常依赖于数据来提供服务的公司飞速发展。拥有庞大的用户基数的他们如何运用这些数据为用户提供个性化推荐是他们的业务重点。而运用推荐算法对数据进行处理正是解决他们业务问题的有效方式之一。目前常用的推荐算可以分为以下 3 类:基于协同过滤的推荐、基于内容的推荐和混合型推荐[21]。其中基于协同过滤的推荐是应用最广泛的。下面我们将对这 3 类推荐算法进行分析。2.3.1 基于协同过滤的推荐基于协同过滤的推荐算法是推荐系统中应用最成熟的算法之一。基于协同过滤的推荐核心思想:利用用户行为数据信息对用户进行特征抽取,其通过计算用户与物品相关性来寻找新的用户与物品间的相关性来为当前用户进行推荐[22]。

组件,相似度,或物


图 3-1 Mahout 中各组件间关系图taModel 实现数据存储功能并为计算提供其所需的偏好、用户和们需要将原始数据映射成 Mahout 兼容格式这个过程中我们需要对预处理。UserSimilarity(计算用户间的相似度)、ItemSimilarity(相似度)、UserNeighborhood(计算用户或物品间的“近邻”关ender 通过上述组件得出计算结果作为参数得到最终的用户推荐 的中也提供了推荐评测的组件。这方便了对推荐结果的评估。完步骤如下:1)收集用户或物品特征等相关数据,把收集到的特征数据进行数数据中的冗余和空值(即降低稀疏)。减少数据本身之外的信息对响。2)调优推荐组件相似度计算组件、邻近关系组件。用户或物品之算。对于相似度的度量,其中有很多种方法如对数似然比相似度似度、欧几里得相似度等。再通过近邻算法组件选择最近邻居集

【参考文献】:
期刊论文
[1]基于Hadoop和Mahout的大数据管理分析系统[J]. 刘文峰,顾君忠,林欣,陈鹏.  计算机应用与软件. 2015(01)
[2]协同过滤推荐技术综述[J]. 冷亚军,陆青,梁昌勇.  模式识别与人工智能. 2014(08)
[3]基于Mahout的推荐系统的分析与设计[J]. 朱倩,钱立.  科技通报. 2013(06)
[4]Hadoop HDFS和MapReduce架构浅析[J]. 郝树魁.  邮电设计技术. 2012(07)
[5]基于Hadoop的海量数据存储平台设计与开发[J]. 崔杰,李陶深,兰红星.  计算机研究与发展. 2012(S1)
[6]推荐算法综述[J]. 杨博,赵鹏飞.  山西大学学报(自然科学版). 2011(03)
[7]MapReduce:新型的分布式并行计算编程模型[J]. 李成华,张新访,金海,向文.  计算机工程与科学. 2011(03)
[8]基于Hadoop MapReduce模型的应用研究[J]. 谢桂兰,罗省贤.  微型机与应用. 2010(08)
[9]个性化推荐系统评价方法综述[J]. 刘建国,周涛,郭强,汪秉宏.  复杂系统与复杂性科学. 2009(03)
[10]协同过滤推荐算法综述[J]. 马宏伟,张光卫,李鹏.  小型微型计算机系统. 2009(07)

博士论文
[1]基于协同过滤的推荐算法研究[D]. 刘青文.中国科学技术大学 2013

硕士论文
[1]Mahout音乐推荐引擎关键技术研究[D]. 李媛媛.兰州理工大学 2018
[2]基于Mahout的电子商务个性化推荐系统的设计与实现[D]. 刘媛媛.中国科学院大学(中国科学院工程管理与信息技术学院) 2017
[3]基于Storm的实时推荐系统的设计与实现[D]. 朱群.西安电子科技大学 2017
[4]基于Mahout的电影推荐系统的设计与实现[D]. 李松.华中科技大学 2016
[5]基于Hadoop的协同过滤推荐算法的设计与实现[D]. 李状.南京邮电大学 2016
[6]面向移动终端的新闻推荐系统的研究与实现[D]. 冯晨.华北电力大学(北京) 2016
[7]基于MapReduce的软件网络模体查找算法研究[D]. 李俊.东北大学 2014
[8]基于Apache Mahout的推荐算法的研究与实现[D]. 常江.电子科技大学 2013
[9]基于Mahout的推荐系统的研究与实现[D]. 马宁.兰州大学 2013
[10]基于MapReduce的模体发现问题算法研究[D]. 林帅.西安电子科技大学 2012



本文编号:2994726

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2994726.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户03bd8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com