并行推荐算法的研究与实现
发布时间:2017-05-22 18:06
本文关键词:并行推荐算法的研究与实现,由笔耕文化传播整理发布。
【摘要】:近年来,随着智能手机以及互联网的快速发展,基于网络的应用服务发展越来越迅猛,给人们带来了更加丰富多元的网络生活。然而,用户同时需要面对大量网络应用服务提供的信息和产品,从而导致信息过载问题的产生。解决信息过载问题的主要途径有搜索引擎和推荐系统。传统的搜索引擎根据用户输入的关键字提供相关的信息,缺少一定的内容与用户的相关性分析。推荐系统是解决信息超载问题的另一个非常有效的途径,它是根据用户的基本信息、兴趣、历史浏览记录等,将用户有可能感兴趣的产品和信息推荐给用户的个性的推荐系统。相对搜索引擎来说,个性化推荐系统通过研究用户的兴趣偏好,进行个性化的推荐,由系统发现并推荐给用户潜在兴趣点,帮助用户找到感兴趣的信息。然而随着数据量的增长,传统的单机推荐算法将不可避免遇到性能上的瓶颈,针对大规模数据的推荐算法的并行化研究需求日益增长。 本论文先简要介绍了并行计算框架Hadoop的并行化机制和应用,以及推荐系统相关的基本概念和理论基础,然后介绍了现主流的推荐算法、面临的问题和相似度量公式等问题。随后介绍了基于矩阵因子分解、基于用户和基于物品的协同过滤推荐算法的并行化研究与实现,提出了一种快速的分布式的随机梯度下降算法FDSGD用于求解矩阵因子分解问题,并对算法的性能进行了比较。同时介绍了推荐算法的一般评估准则以及评估算法的实现。最后根据实现的基于物品的推荐算法和基于矩阵因子分解的推荐算法,设计并实现了一个图书推荐系统,直观展示了算法与实际相结合的应用场景。
【关键词】:推荐算法 并行化 矩阵因子分解 推荐系统
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
- 摘要4-5
- ABSTRACT5-10
- 第一章 绪论10-15
- 1.1 课题研究背景与现状10-12
- 1.2 课题的研究内容和意义12-13
- 1.3 论文结构安排13-15
- 第二章 相关概念与技术15-23
- 2.1 推荐系统15
- 2.2 相似度度量15-18
- 2.2.1 皮尔森相似度(Pearson Correlation)16
- 2.2.2 欧式距离相似度(Euclidean Di stance Similarity)16-17
- 2.2.3 余弦相似度(Cosine Similarity)17
- 2.2.4 调整余弦相似度(Adjusted Cosine Similarity)17-18
- 2.3 常用推荐算法18-21
- 2.3.1 基于矩阵因子分解的推荐算法18-19
- 2.3.2 基于用户的协同过滤推荐算法19-20
- 2.3.3 基于物品的协同过滤推荐算法20
- 2.3.4 其他方法简介20-21
- 2.4 可能面临的问题21-22
- 2.4.1 稀疏性问题21
- 2.4.2 冷启动问题21-22
- 2.4.3 可扩展性问题22
- 2.5 小结22-23
- 第三章 推荐算法的并行化研究与实现23-47
- 3.1 评分矩阵23-25
- 3.2 基于矩阵因子分解的推荐算法并行化研究与实现25-36
- 3.2.1 矩阵分解问题25-26
- 3.2.2 随机梯度下降算法26-27
- 3.2.3 并行化研究与实现27-36
- 3.3 基于用户的协同推荐算法并行化研究与实现36-40
- 3.3.1 用户相似度36-38
- 3.3.2 推荐物品38-40
- 3.4 基于物品的协同推荐算法并行化研究与实现40-43
- 3.4.1 物品相似度40-41
- 3.4.2 推荐物品41-43
- 3.5 实验分析43-46
- 3.5.1 实验环境与数据集43-44
- 3.5.2 FDSGD实验分析44-45
- 3.5.3 User CF与Item CF实验分析45-46
- 3.6 小结46-47
- 第四章 推荐算法评估47-52
- 4.1 评估方案概述47-50
- 4.1.1 评分预测准确度48-49
- 4.1.2 分类准确度49-50
- 4.2 评估方法实现50-51
- 4.3 评估实验51
- 4.4 小结51-52
- 第五章 图书推荐系统设计与实现52-66
- 5.1 需求分析52-56
- 5.1.1 需求概述52-56
- 5.1.2 运行环境概述56
- 5.2 总体设计56-58
- 5.2.1 系统架构56-57
- 5.2.2 数据库设计57-58
- 5.3 详细设计与实现58-65
- 5.3.1 用户管理模块58-60
- 5.3.2 非个性化推荐模块60-63
- 5.3.3 推荐模块63-65
- 5.4 小结65-66
- 第六章 总结与展望66-68
- 6.1 总结66-67
- 6.2 展望67-68
- 参考文献68-70
- 致谢70-71
- 攻读学位期间发表的学术论文目录71
【参考文献】
中国期刊全文数据库 前3条
1 刘建国;周涛;郭强;汪秉宏;;个性化推荐系统评价方法综述[J];复杂系统与复杂性科学;2009年03期
2 蔡伟杰,张晓辉,朱建秋,朱扬勇;关联规则挖掘综述[J];计算机工程;2001年05期
3 曾春,邢春晓,周立柱;基于内容过滤的个性化搜索算法[J];软件学报;2003年05期
本文关键词:并行推荐算法的研究与实现,由笔耕文化传播整理发布。
,本文编号:386455
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/386455.html