基于协同过滤的个性化物品推荐
本文关键词:基于协同过滤的个性化物品推荐
更多相关文章: 个性化推荐 协同过滤 二部图社区发现 Mapreduce
【摘要】:随着网络的发展,我们进入了一个信息爆炸的时代。用户很难从海量的信息中迅速准确地找出自己真正想要的内容。推荐系统在用户和信息之间搭建了一个桥梁,能够发掘用户的潜在兴趣点并推荐给用户,降低了用户搜寻信息的成本。因此,推荐系统受到普遍的关注和应用。其中,协同过滤推荐算法应用范围最为广泛。但是仍然存在评分数据稀疏、扩展性差、推荐正确率低等问题。为了克服协同过滤中评分稀疏、正确率低的问题,可以将推荐系统中用户和物品看作是抽象于内容的独立节点,构建用户、物品二部图网络,在二部图网络的基础上利用二部图模块函数优化的方法进行社区发现,从而将有内在联系的用户和物品聚类在一起,在此基础上进行个性化推荐。因此,本文给出了基于社区的协同过滤推荐算法,算法可以分为三个步骤:数据表述、相似性计算、推荐生成。在数据表述阶段,将传统的用户-物品评分矩阵转化为二部图结构;然后将二部图看做网络拓扑图,在该网络上利用二部图模块函数优化的方法进行社区挖掘,将相似的物品或者相似的用户划分到同一个社区中去,完成相似性计算;在推荐生成阶段,综合考虑了基于用户社区划分的推荐列表和基于物品社区划分的推荐列表,将两个推荐列表进行了两种形式的混合,综合利用了用户和物品的相似关系。根据评分的大小从高到低进行排列,取前N个物品推荐给目标用户。为了解决算法的可扩展性问题,本文在Hadoop大数据平台上利用Mapreduce编程框架分别实现了基于社区的协同过滤推荐算法和基于物品的协同过滤推荐算法,算法主要分为数据预处理、算法实现、性能测评三个步骤,利用正确率、召回率、F值指标来综合衡量对比算法的性能优劣。借助大数据平台来实现算法可较大幅度提高的实现效率,降低时间复杂度,扩展了算法的应用领域。
【关键词】:个性化推荐 协同过滤 二部图社区发现 Mapreduce
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要5-6
- Abstract6-10
- 第1章 绪论10-13
- 1.1 研究意义10-11
- 1.2 研究内容11-12
- 1.3 论文结构12-13
- 第2章 研究现状13-30
- 2.1 推荐系统13-17
- 2.1.1 算法分类13-16
- 2.1.2 评价指标16-17
- 2.2 协同过滤17-24
- 2.2.1 算法内容17-20
- 2.2.2 算法分类20-23
- 2.2.3 算法特点23-24
- 2.3 协同过滤算法面临的问题24-26
- 2.3.1 评分稀疏24-25
- 2.3.2 可扩展性25-26
- 2.4 分布式计算26-30
- 2.4.1 Hadoop概述26-27
- 2.4.2 Hadoop的Mapreduce编程模型27-28
- 2.4.3 Hadoop的分布式文件系统28-29
- 2.4.4 Hbase分布式存储系统29
- 2.4.5 Hive数据仓库29-30
- 第3章 基于社区发现的协同过滤算法30-44
- 3.1 引言30-31
- 3.2 算法描述31-34
- 3.2.1 符号简介31-32
- 3.2.2 社区划分32-33
- 3.2.3 个性化推荐33-34
- 3.3 实验34-44
- 3.3.1 数据集34-35
- 3.3.2 实验结果35-44
- 第4章 基于HADOOP的协同过滤算法44-58
- 4.1 引言44-45
- 4.2 基于物品相似性的协同过滤算法的Mapreduce实现45-49
- 4.3 基于社区发现的协同过滤算法的Mapreduce实现49-54
- 4.4 实验54-58
- 4.4.1 数据准备54-55
- 4.4.2 实验结果55-58
- 总结及展望58-60
- 参考文献60-65
- 攻读学位期间发表论文与研究成果清单65-66
- 致谢66
【相似文献】
中国期刊全文数据库 前10条
1 杨风召;;一种基于特征表的协同过滤算法[J];计算机工程与应用;2007年06期
2 王岚;翟正军;;基于时间加权的协同过滤算法[J];计算机应用;2007年09期
3 曾子明;张李义;;基于多属性决策和协同过滤的智能导购系统[J];武汉大学学报(工学版);2008年02期
4 张富国;;用户多兴趣下基于信任的协同过滤算法研究[J];小型微型计算机系统;2008年08期
5 侯翠琴;焦李成;张文革;;一种压缩稀疏用户评分矩阵的协同过滤算法[J];西安电子科技大学学报;2009年04期
6 廖新考;;基于用户特征和项目属性的混合协同过滤推荐[J];福建电脑;2010年07期
7 沈磊;周一民;李舟军;;基于心理学模型的协同过滤推荐方法[J];计算机工程;2010年20期
8 徐红;彭黎;郭艾寅;徐云剑;;基于用户多兴趣的协同过滤策略改进研究[J];计算机技术与发展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合协同过滤算法[J];微计算机信息;2011年11期
10 郑婕;鲍海琴;;基于协同过滤推荐技术的个性化网络教学平台研究[J];科技风;2012年06期
中国重要会议论文全文数据库 前10条
1 沈杰峰;杜亚军;唐俊;;一种基于项目分类的协同过滤算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 董全德;;基于双信息源的协同过滤算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 张光卫;康建初;李鹤松;刘常昱;李德毅;;面向场景的协同过滤推荐算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 王明文;陶红亮;熊小勇;;双向聚类迭代的协同过滤推荐算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 胡必云;李舟军;王君;;基于心理测量学的协同过滤相似度方法(英文)[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 林丽冰;师瑞峰;周一民;李月雷;;基于双聚类的协同过滤推荐算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 罗喜军;王韬丞;杜小勇;刘红岩;何军;;基于类别的推荐——一种解决协同推荐中冷启动问题的方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
中国博士学位论文全文数据库 前10条
1 李聪;电子商务推荐系统中协同过滤瓶颈问题研究[D];合肥工业大学;2009年
2 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
3 罗恒;基于协同过滤视角的受限玻尔兹曼机研究[D];上海交通大学;2011年
4 薛福亮;电子商务协同过滤推荐质量影响因素及其改进机制研究[D];天津大学;2012年
5 高e,
本文编号:913699
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/913699.html