基于权重调节和用户偏好的混合协同过滤算法研究
发布时间:2022-01-01 16:57
互联网的发展让人们获取信息的方式越来越便利,但随之而来爆炸式增长的信息量,让用户如何从海量的信息中提取到有用的信息、提高信息的有效利用率成为亟待解决的问题。推荐系统的出现是解决这些问题非常有潜能的方向。且推荐系统是连接用户和信息的桥梁,现已应用在多个领域为用户、信息创造价值。推荐系统的成功应用离不开推荐算法的使用。现在应用较多的协同过滤算法从发展之初到现在已经成为互联网推荐中最常用的算法。关于协同过滤算法已经有学者做出了很多相关的研究,但是在数据稀疏、可扩展性等方面的问题仍然没有得到很好的解决。随着数据量的增加,这些问题会越来越突显。为了缓解数据稀疏和相似度计算不准确的问题,本文针对协同过滤算法做了以下方面的改进,具体内容如下:一.将加权Slope One算法引入到评分预测过程中,得到基于加权Slope One的混合协同过滤算法。通过加权Slope One算法基于项目的评分预测填充用户近邻集合内目标项目无评分的项目,缓解用户评分矩阵的稀疏性,提高了原协同过滤算法的推荐准确度。本文根据实验验证了算法的有效性。二.传统的相似度计算只考虑原有的用户项目评分信息使得相似度的计算不准确,因此提出...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
CF算法分类
图 2.2 基于用户的 CF 推荐算法从上面的描述来看,来看一下从用户角度出发的 CF 具体的实现过程:第一步,搜集用户的偏好,也就是用户的打分行为,观看行为,购买行为等能够表示用户喜好的行为,将其规范整理成为用户对项目喜好程度数据;第二步,根据第一步收集整理的数据,用户最近邻居集合的挑选有两类常用方法,一是基于 k 近邻的邻居选取,将其他用户按与目标用户相似度的值从大到小排列,然后取前 k 个用户作为近邻集合。这样的选取当用户邻居数量稀疏时,容易选取一些与推荐用户相似度不大的孤立点。二是基于阈值的邻居选取,与推荐系统内其他用户计算相似度时,如果计算的值在阈值以内,那么就可以把该用户划分到邻居集合里,就是以用户 A 为中心点半径为 k 的所有在圆内的用户,这样的选取办法就是每个用户的邻居数量都是不确定的,但是可以避免一些孤立点的选取。第三步,根据第二步得到的目标邻居集合,预测目标用户每个没有打分的物
第 2 章 推荐算法和相关技术介绍的 CF 的第二步变为计算物品与物品间的相似度,然后推荐给用户喜欢物品相似度较高的前 N 个物品。如图 2.3 所示,推荐系统中的用户集合有{Auser ,Buser ,Cuser },项目集合有{1item ,2item ,3item }。可以看出来,喜欢1item 的用户同时也喜欢3item ,因此1item 和3item 在某类程度上是相似的,对用户 C 推荐时,发现用户 C 喜欢1item ,因此我们可将3item 推荐给用户 A。
【参考文献】:
期刊论文
[1]基于信任机制下概率矩阵分解的用户评分预测[J]. 杜东舫,徐童,鲁亚男,管楚,刘淇,陈恩红. 软件学报. 2018(12)
[2]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[3]一种解决新项目冷启动问题的推荐算法[J]. 于洪,李俊华. 软件学报. 2015(06)
[4]个性化推荐算法研究[J]. 陈洁敏,汤庸,李建国,蔡奕彬. 华南师范大学学报(自然科学版). 2014(05)
[5]基于近邻评分填补的协同过滤推荐算法[J]. 冷亚军,梁昌勇,陆青,陆文星. 计算机工程. 2012(21)
[6]推荐系统评价指标综述[J]. 朱郁筱,吕琳媛. 电子科技大学学报. 2012(02)
[7]基于约束的旅游推荐系统的研究与设计[J]. 王显飞,陈梅,李小天. 计算机技术与发展. 2012(02)
[8]Web搜索引擎框架研究[J]. 张卫丰,徐宝文. 计算机研究与发展. 2000(03)
本文编号:3562452
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
CF算法分类
图 2.2 基于用户的 CF 推荐算法从上面的描述来看,来看一下从用户角度出发的 CF 具体的实现过程:第一步,搜集用户的偏好,也就是用户的打分行为,观看行为,购买行为等能够表示用户喜好的行为,将其规范整理成为用户对项目喜好程度数据;第二步,根据第一步收集整理的数据,用户最近邻居集合的挑选有两类常用方法,一是基于 k 近邻的邻居选取,将其他用户按与目标用户相似度的值从大到小排列,然后取前 k 个用户作为近邻集合。这样的选取当用户邻居数量稀疏时,容易选取一些与推荐用户相似度不大的孤立点。二是基于阈值的邻居选取,与推荐系统内其他用户计算相似度时,如果计算的值在阈值以内,那么就可以把该用户划分到邻居集合里,就是以用户 A 为中心点半径为 k 的所有在圆内的用户,这样的选取办法就是每个用户的邻居数量都是不确定的,但是可以避免一些孤立点的选取。第三步,根据第二步得到的目标邻居集合,预测目标用户每个没有打分的物
第 2 章 推荐算法和相关技术介绍的 CF 的第二步变为计算物品与物品间的相似度,然后推荐给用户喜欢物品相似度较高的前 N 个物品。如图 2.3 所示,推荐系统中的用户集合有{Auser ,Buser ,Cuser },项目集合有{1item ,2item ,3item }。可以看出来,喜欢1item 的用户同时也喜欢3item ,因此1item 和3item 在某类程度上是相似的,对用户 C 推荐时,发现用户 C 喜欢1item ,因此我们可将3item 推荐给用户 A。
【参考文献】:
期刊论文
[1]基于信任机制下概率矩阵分解的用户评分预测[J]. 杜东舫,徐童,鲁亚男,管楚,刘淇,陈恩红. 软件学报. 2018(12)
[2]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[3]一种解决新项目冷启动问题的推荐算法[J]. 于洪,李俊华. 软件学报. 2015(06)
[4]个性化推荐算法研究[J]. 陈洁敏,汤庸,李建国,蔡奕彬. 华南师范大学学报(自然科学版). 2014(05)
[5]基于近邻评分填补的协同过滤推荐算法[J]. 冷亚军,梁昌勇,陆青,陆文星. 计算机工程. 2012(21)
[6]推荐系统评价指标综述[J]. 朱郁筱,吕琳媛. 电子科技大学学报. 2012(02)
[7]基于约束的旅游推荐系统的研究与设计[J]. 王显飞,陈梅,李小天. 计算机技术与发展. 2012(02)
[8]Web搜索引擎框架研究[J]. 张卫丰,徐宝文. 计算机研究与发展. 2000(03)
本文编号:3562452
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3562452.html
最近更新
教材专著