混合推荐算法在云计算平台的研究与应用
本文关键词:混合推荐算法在云计算平台的研究与应用,由笔耕文化传播整理发布。
【摘要】:随着互联网信息开放式的发展,互联网中的信息指数式增长,信息过载的问题日益严重。如何在大量的信息中筛选出用户需要的信息成为当今互联网急需解决的问题。推荐系统就是诞生在这样的背景下,推荐系统可以根据一定的算法挖掘出用户需要的有效信息。随着推荐系统的发展,其核心的推荐算法也层出不穷。因此本文选择推荐算法作为研究的重点之一。在推荐算法中协同过滤是比较成熟的推荐技术。然而协同过滤技术中,由于其过度依赖于用户项目的评分矩阵,在有效数据不足的条件下,推荐准确度会随着矩阵的稀疏而下降。本文针对于协同过滤技术中的评分矩阵的稀疏性问题,提出了一种结合项目属性相似性的混合推荐算法。在基于项目的协同过滤相似性计算的过程中,通过评分矩阵用户的评分聚集程度产生动态因子,将基于项目本身属性的相似性与协同过滤中项目相似性动态结合,从而解决了矩阵的稀疏性问题。通过实验的比较可以得出,本文设计的混合推荐算法对比传统的协同过滤具有较好的准确度。混合推荐算法的预测虽然有较好的准确性,但是算法过程的融合导致算法复杂度增加。因此本文将推荐算法与Hadoop云计算平台进行了结合,在对Hadoop平台中的分布式文件系统HDFS和MapReduce并行编程模型深入研究后,将推荐算法中复杂的项目相似度计算过程MapReduce并行化,提高了算法的计算效率。通过MovieLens的数据集合实验证明,混合推荐算与Hadoop云计算平台具有比较好的并行性能,同时也凸显了Hadoop云计算平台的优势。本文深入的研究了推荐算法和云计算的相关知识后,针对协同过滤的问题提出了混合推荐算法,并将算法与Hadoop云计算平台相结合,提高算法运算效率。实验证明,混合推荐算法与云计算平台的结合具有较好的推荐质量和较高的运算效率。
【关键词】:推荐算法 混合推荐 协同过滤 云计算 Hadoop平台
【学位授予单位】:中国科学院研究生院(沈阳计算技术研究所)
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要5-6
- ABSTRACT6-9
- 引言9-11
- 第一章 绪论11-16
- 1.1 课题研究的意义11-13
- 1.2 国内外研究现状13-14
- 1.3 研究工作的项目背景和目标14-15
- 1.4 论文结构和内容安排15-16
- 第二章 相关技术研究16-27
- 2.1 推荐算法概述16-20
- 2.1.1 基于内容的推荐算法16-18
- 2.1.2 基于协同过滤的推荐算法18-19
- 2.1.3 混合推荐算法19-20
- 2.3 云计算概述20-22
- 2.3.1 云计算的介绍20-21
- 2.3.2 云计算特点21
- 2.3.3 云计算的关键技术21-22
- 2.4 开源云计算平台Hadoop22-26
- 2.4.1 Hadoop简介22
- 2.4.2 HDFS分布式文件系统22-24
- 2.4.3 MapReduce编程模型24-26
- 2.5 本章小结26-27
- 第三章 混合推荐算法的研究与设计27-37
- 3.1 基本理论27-29
- 3.1.1 评分矩阵28
- 3.1.2 相似度的计算方法28-29
- 3.2 项目属性相似性的计算29-31
- 3.3 综合相似性的计算31-32
- 3.4 用户相似性的计算32-33
- 3.5 综合评分预测33-34
- 3.6 推荐过程34-35
- 3.7 算法架构35-36
- 3.8 本章小结36-37
- 第四章 Hadoop平台上的混合推荐算法并行化实现37-48
- 4.1 推荐过程分析37
- 4.2 相似性计算MapReduce并行化37-45
- 4.2.1 项目评分相似性计算并行化38-40
- 4.2.2 项目属性相似性计算并行化40-42
- 4.2.3 综合相似性计算并行化42-44
- 4.2.4 相似性排序计算并行化44-45
- 4.3 用户相似性计算MapReduce并行化45-46
- 4.4 并行化过程数据的处理和保存46-47
- 4.5 本章小结47-48
- 第五章 算法实验与结果分析48-56
- 5.1 Hadoop平台环境的搭建48-51
- 5.1.1 软硬件描述48
- 5.1.2 Haoop环境搭建48-51
- 5.2 实验设计与结果分析51-55
- 5.2.1 实验数据51-52
- 5.2.2 度量标准52
- 5.2.3 实验结果52-55
- 5.3 本章小结55-56
- 第六章 总结与展望56-58
- 6.1 本文的总结56-57
- 6.2 下一步计划57-58
- 参考文献58-60
- 发表文章60-61
- 致谢61
【相似文献】
中国期刊全文数据库 前10条
1 徐义峰;徐云青;刘晓平;;一种基于时间序列性的推荐算法[J];计算机系统应用;2006年10期
2 余小鹏;;一种基于多层关联规则的推荐算法研究[J];计算机应用;2007年06期
3 张海玉;刘志都;杨彩;贾松浩;;基于页面聚类的推荐算法的改进[J];计算机应用与软件;2008年09期
4 张立燕;;一种基于用户事务模式的推荐算法[J];福建电脑;2009年03期
5 王晗;夏自谦;;基于蚁群算法和浏览路径的推荐算法研究[J];中国科技信息;2009年07期
6 周珊丹;周兴社;王海鹏;倪红波;张桂英;苗强;;智能博物馆环境下的个性化推荐算法[J];计算机工程与应用;2010年19期
7 王文;;个性化推荐算法研究[J];电脑知识与技术;2010年16期
8 张恺;秦亮曦;宁朝波;李文阁;;改进评价估计的混合推荐算法研究[J];微计算机信息;2010年36期
9 夏秀峰;代沁;丛丽晖;;用户显意识下的多重态度个性化推荐算法[J];计算机工程与应用;2011年16期
10 杨博;赵鹏飞;;推荐算法综述[J];山西大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 王韬丞;罗喜军;杜小勇;;基于层次的推荐:一种新的个性化推荐算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 唐灿;;基于模糊用户心理模式的个性化推荐算法[A];2008年计算机应用技术交流会论文集[C];2008年
3 秦国;杜小勇;;基于用户层次信息的协同推荐算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 周玉妮;郑会颂;;基于浏览路径选择的蚁群推荐算法:用于移动商务个性化推荐系统[A];社会经济发展转型与系统工程——中国系统工程学会第17届学术年会论文集[C];2012年
5 苏日启;胡皓;汪秉宏;;基于网络的含时推荐算法[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
6 梁莘q,
本文编号:410242
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/410242.html