当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于MAHOUT的几种推荐算法的组合实现与评测

发布时间:2017-05-29 05:12

  本文关键词:基于MAHOUT的几种推荐算法的组合实现与评测,由笔耕文化传播整理发布。


【摘要】:互联网的产生使得电子商务得到了前所未有的发展,伴随而来的是商品数目与种类的爆炸式增长。在这种背景下,用户在繁杂的信息中需要花费大量的时间和精力来寻找自己想要的商品,与此同时不同的用户有自己独特的需求。针对此类问题,初期传统的互联网企业有两种解决方案,一是采用分类目录;二是搜索引擎。但是两者有一个共同的局限:需要用户主动提出自己的需求。但是有时候用户无法十分确切描述出自己的需求,为了帮助用户快捷准确的锁定自己感兴趣的物品或信息,个性化推荐系统应运而生。其利用数据挖掘技术,具有高度智能化,能够为用户提供完全个性化的决策支持和信息服务。推荐系统要想使用户获得良好的体验度,作为其核心的推荐算法的重要性不言而喻。目前实际生产中最常用的推荐算法要数协同过滤推荐算法,所谓协同过滤算法就是抓住用户选择商品这一本质,利用用户与商品间的关系,分析用户兴趣,挖掘不同用户之间的相似性或者不同物品之间的相似性,通过各种不同的计算方法形成用户对未知商品的喜好程度的预测。本文所作的主要工作有:1.详细阐述了课题的研究背景,国内外的发展历史及研究现状。2.对推荐系统相关的主要技术进行了详细的阐述,其中重点分析推荐引擎的分类及评测标准。3.利用mahout协同过滤开发模型实现了几种推荐算法的组合,并在Amazon图书数据集上进行了评估、算法的人工验证和手动调优。本文的主要创新点:1.在深入剖析mahout协同过滤算法框架的基础上,对系统实现过程和推荐结果以及对结果的评测进行了跟踪、分析。2.采用限定用户属性的方法优化推荐过程,使推荐结果更加合理,准确。本文通过在Amazon图书数据集上进行的组合算法的实现表明:在数据集比较小的情况下,推荐的结果并不理想;通过限定用户属性的方法,可以使预测结果的均方根误差明显减小,算法更加稳定。本文的工作对推荐系统的实际应用有一定的参考价值。
【关键词】:推荐引擎 协同过滤 mahout 算法评测
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第一章 绪论10-13
  • 1.1 课题的研究背景10-11
  • 1.2 相关研究历史及现状11-12
  • 1.2.1 国外研究历史及应用现状11
  • 1.2.2 国内研究历史及应用现状11-12
  • 1.3 论文的研究内容和组织结构12-13
  • 第二章 相关技术综述13-16
  • 2.1 Hadoop分布式系统13-14
  • 2.1.1 Hdfs分布式文件系统13-14
  • 2.1.2 MapReduce编程模型14
  • 2.2 mahout机器学习算法库14
  • 2.3 maven项目管理框架14-15
  • 2.4 本章小结15-16
  • 第三章 推荐引擎16-35
  • 3.1 推荐引擎的技术原理16-17
  • 3.2 推荐系统分类及常用算法17-21
  • 3.3 推荐系统评测指标21-26
  • 3.4 MAHOUT协同过滤推荐引擎Taste26-34
  • 3.4.1 mahout数据模型27-29
  • 3.4.2 mahout相似度算法29-32
  • 3.4.3 mahout近邻算法32-33
  • 3.4.4 mahout推荐器33-34
  • 3.5 本章小结34-35
  • 第四章 MAHOUT协同过滤推荐算法实现35-50
  • 4.1 MAHOUT推荐引擎开发模型35-36
  • 4.2 实验策略综述36-39
  • 4.2.1 实验步骤36
  • 4.2.2 算法组合36-37
  • 4.2.3 算法评测标准37-39
  • 4.3 实验数据集39-40
  • 4.4 开发环境搭建40-42
  • 4.4.1 开发环境介绍40
  • 4.4.2 开发环境搭建过程40-42
  • 4.5 实验过程及分析42-49
  • 4.6 本章小结49-50
  • 第五章 总结和展望50-51
  • 5.1 总结50
  • 5.2 展望50-51
  • 参考文献51-53
  • 致谢53

【参考文献】

中国期刊全文数据库 前1条

1 林树地;吴扬扬;;基于Hadoop的C4.5决策树分类算法并行化[J];微型机与应用;2013年12期

中国博士学位论文全文数据库 前2条

1 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年

2 董振华;群落标签推荐系统体系结构及关键问题研究[D];南开大学;2012年


  本文关键词:基于MAHOUT的几种推荐算法的组合实现与评测,,由笔耕文化传播整理发布。



本文编号:404230

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/404230.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9ef13***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com