基于项目相似度改进的协同过滤TopN推荐算法研究
本文关键词:基于项目相似度改进的协同过滤TopN推荐算法研究,,由笔耕文化传播整理发布。
【摘要】:随着互联网、物联网以及云计算等技术地快速发展,我们的生活也发生了翻天覆地的变化。我们在享受先进技术带来的便捷的同时,也承受着它们所带来的负面影响,信息过载就是其中之一。针对信息过载问题,早期主要有分类目录与搜索引擎两种解决方法,但均有其局限性,分类目录只能覆盖少数项目,相对于海量项目来说远远不够;搜索引擎则需要有明确需求,无法满足用户的个性化需求。为了更进一步解决信息过载这一难题,研究人员提出了推荐系统概念。推荐系统通过对用户历史行为地分析,发掘出用户潜藏的兴趣喜好,并且能够实现对用户的个性化推荐。推荐系统的核心部分就是推荐算法,现今在实际系统中运用最为广泛的算法就是协同过滤推荐算法。但是,随着推荐系统的进一步应用,传统的协同过滤推荐算法存在的诸如冷启动、数据稀疏性、推荐精度低、长尾项目发掘能力低等问题,使其不再满足实际应用需求。目前针对推荐系统的研究十分火热,不过相当多的研究工作主要将焦点放在如何提高推荐的准确度上,虽然取得了一定成果,但是无法兼顾推荐结果的新颖度,导致推荐新颖度仍处于比较低的水平。本文提出了基于项目相似度改进的协同过滤TopN推荐算法,该算法主要研究目的在于增强长尾项目发掘能力的同时,不降低推荐结果的精度。主要工作包括:1.分析用户活跃度对推荐结果的影响,引入用户活跃度概念,削弱活跃用户对推荐结果的影响,提高长尾项目的发掘能力,提高推荐结果的覆盖率。2.分析项目种类对推荐结果的影响,对相似度矩阵进行归一化处理,削弱同类项目只见相似度过高对推荐结果的影响,提高推荐结果的精度,增强推荐结果的可靠性。3.采用推荐领域经典的MovieLens数据集对改进算法进行分步仿真,验证改进算法每一步骤的有效性。
【关键词】:协同过滤 项目相似度 用户活跃度 新颖度
【学位授予单位】:安徽理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要5-6
- Abstract6-12
- 1 绪论12-18
- 1.1 研究背景及意义12-14
- 1.1.1 信息过载产生原因12-13
- 1.1.2 信息过载传统解决方法13
- 1.1.3 推荐系统13-14
- 1.2 推荐系统的研究现状14-16
- 1.3 本文的研究内容16
- 1.4 本文的组织架构16-18
- 2 研究理论基础18-30
- 2.1 相关技术18-20
- 2.1.1 信息检索18
- 2.1.2 信息过滤18-19
- 2.1.3 数据挖掘19-20
- 2.2 推荐算法概述20-28
- 2.2.1 基于内容的推荐算法21-22
- 2.2.2 基于协同过滤的推荐算法22-25
- 2.2.3 基于关联规则的推荐25
- 2.2.4 基于聚类的推荐25
- 2.2.5 基于知识的推荐25-26
- 2.2.6 基于上下文感知的推荐26
- 2.2.7 社交网络推荐26-27
- 2.2.8 混合推荐算法27-28
- 2.3 相关理论28-30
- 2.3.1 长尾理论28
- 2.3.2 马太效应28-30
- 3 基于项目相似度改进的协同过滤TopN推荐算法30-37
- 3.1 用户行为数据30-31
- 3.1.1 用户行为数据简介30
- 3.1.2 用户行为数据分类30-31
- 3.1.3 数据集分类31
- 3.2 基于项目的协同过滤算法主要步骤31-34
- 3.2.1 建立用户-项目反馈信息矩阵R(m,n)31-32
- 3.2.2 项目相似度计算32-33
- 3.2.3 推荐列表生成33-34
- 3.3 基于项目相似度改进的协同过滤TopN推荐算法34-37
- 3.3.1 项目相似度计算公式改进34
- 3.3.2 项目相似度的归一化34-35
- 3.3.3 TopN推荐35-37
- 4 实验设计与算法评测37-48
- 4.1 推荐系统实验方法37-40
- 4.1.1 离线实验38
- 4.1.2 用户调查38-39
- 4.1.3 在线实验39-40
- 4.2 评测指标40-44
- 4.2.1 用户满意度40-41
- 4.2.2 准确度评价41-42
- 4.2.3 覆盖率42-43
- 4.2.4 新颖度43-44
- 4.3 实验设计与结果分析44-48
- 4.3.1 数据集选用44
- 4.3.2 本文实验设计44
- 4.3.3 实验结果与分析44-48
- 5 总结与展望48-50
- 5.1 总结48
- 5.2 展望48-50
- 参考文献50-53
- 致谢53-54
- 作者简介及读研期间主要科研成果54
【相似文献】
中国期刊全文数据库 前10条
1 徐义峰;徐云青;刘晓平;;一种基于时间序列性的推荐算法[J];计算机系统应用;2006年10期
2 余小鹏;;一种基于多层关联规则的推荐算法研究[J];计算机应用;2007年06期
3 张海玉;刘志都;杨彩;贾松浩;;基于页面聚类的推荐算法的改进[J];计算机应用与软件;2008年09期
4 张立燕;;一种基于用户事务模式的推荐算法[J];福建电脑;2009年03期
5 王晗;夏自谦;;基于蚁群算法和浏览路径的推荐算法研究[J];中国科技信息;2009年07期
6 周珊丹;周兴社;王海鹏;倪红波;张桂英;苗强;;智能博物馆环境下的个性化推荐算法[J];计算机工程与应用;2010年19期
7 王文;;个性化推荐算法研究[J];电脑知识与技术;2010年16期
8 张恺;秦亮曦;宁朝波;李文阁;;改进评价估计的混合推荐算法研究[J];微计算机信息;2010年36期
9 夏秀峰;代沁;丛丽晖;;用户显意识下的多重态度个性化推荐算法[J];计算机工程与应用;2011年16期
10 杨博;赵鹏飞;;推荐算法综述[J];山西大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 王韬丞;罗喜军;杜小勇;;基于层次的推荐:一种新的个性化推荐算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 唐灿;;基于模糊用户心理模式的个性化推荐算法[A];2008年计算机应用技术交流会论文集[C];2008年
3 秦国;杜小勇;;基于用户层次信息的协同推荐算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 周玉妮;郑会颂;;基于浏览路径选择的蚁群推荐算法:用于移动商务个性化推荐系统[A];社会经济发展转型与系统工程——中国系统工程学会第17届学术年会论文集[C];2012年
5 苏日启;胡皓;汪秉宏;;基于网络的含时推荐算法[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
6 梁莘q
本文编号:321055
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/321055.html