融合用户偏好和项目关联的协同过滤算法研究
发布时间:2021-11-05 08:07
随着信息时代的到来,海量的信息充斥着现在的社会生活,这对信息的生产者和用户来说都是一项巨大的挑战。推荐系统的产生为解决这个问题提供了有效的解决办法,作为信息生产者与用户之间的桥梁,它能够为用户筛选有价值的信息,同时也能够帮助信息生产者把自己的信息推广到对它感兴趣的用户面前。推荐系统的产生离不开协同过滤算法的发展,协同过滤算法是目前应用较为广泛的推荐算法。虽然目前协同过滤算法已经被应用到许多电子商务网站的推荐系统当中,但是仍然存在一些有待解决的问题。本文针对协同过滤算法中相似度计算未考虑实际场景影响的问题,对相似度计算方法做出了如下的改进:首先,提出了基于用户偏好的相似度计算的改进办法。本文针对热冷门物品对相似度计算的影响,采用热门物品惩罚因子来减少热门物品在相似度计算中所占的比重,并将这种因子引入到余弦相似度计算当中;考虑到用户共同评分项目数量对两用户相似度的影响,我们采用杰西卡相关度计算与改进的余弦相似度计算相结合的方式来进行用户相似度计算。其次,提出了基于项目关联的相似度计算的改进办法。针对传统的相似度计算只考虑项目评分,从而导致项目相关度计算不合理的问题,我们采用了项目的评分相似...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
基于内容的推荐算法示意图
第二章推荐算法及相关概念介绍9图2.2基于用户的协同过滤黑色实线表示用户对该内容感兴趣,黑色虚线则表示系统将该内容推荐给某用户。如上图所示,用户A喜欢内容1,内容4;用户C则对内容1,内容2,内容4。从这些用户的历史行为数据中,可以得出用户A和用户C的具有相似的喜好,由此可以推断出用户A可能对内容2也会感兴趣,所以我们可以把内容2推荐给用户A。传统的UserCF的实现过程可以分为以下三个步骤:(1)首先,根据用户与系统的交互行为,可建立用户-项目评分矩阵。用户的历史行为数据会有很多种,包括:对内容的评分,浏览历史,收藏夹,点赞等,本文通过用户对项目的评分数据进行举例说明,来介绍UserCF算法的计算过程,用户-项目评分矩阵如下表2.1:表2.1用户-项目评分矩阵项目1项目2项目3项目4用户A3004用户B0050用户C3403(2)通过上述的用户-项目评分矩阵中用户对项目的评分数据,再结合上述的相似度计算方式,确定偏好相似的用户集,常用的相似度计算方法已经在本文的2.2.1章节给出了详细介绍。(3)根据用户的相似度,可以得出目标用户的最近邻居KNN,推荐给目标用
第二章推荐算法及相关概念介绍10户。KNN筛选的常用方式有两种:第一种是通过设置用户相似度的阈值,相似度大于该阈值,我们认为两用户为兴趣相似用户,否则,认为两用户不是兴趣相似用户,通过设置阈值过滤掉不相关的用户群;第二种,是通过找到Top-N的用户,得到“邻居”用户群,这种方法,是通过对相似度的值进行排序,从高到低取N个邻居用户。根据具体情况可以选择合适的策略得到最近邻居KNN。2.1.2.2基于项目的协同过滤基于项目(Item)的协同过滤,主要更多考虑的是项目之间的联系,通过确定相似的项目集合,再根据用户在系统中的行为信息,寻找与用户曾经购买过或者浏览过的内容,来为用户推荐用户感兴趣的内容。该算法原理如图2.3所示:图2.3基于项目的协同过滤黑色实线表示用户对该内容感兴趣,黑色虚线则表示系统将该内容推荐给某用户。如图所示,我们可以看出用户A对内容1,内容3感兴趣;用户B对内容1,内容2,内容3;用户C对内容1感兴趣。从用户的历史喜好信息中,可以得出对内容1感兴趣的用户都对内容3感兴趣,内容1和内容3具有相似性,所以系统将会把内容3推荐给用户C。基于项目(Item)的协同过滤算法的推荐过程可以分为以下三个步骤:(1)首先,根据用户的历史行为数据,构建项目-用户行为矩阵,用户的操作行为可以包括:浏览记录,收藏记录,浏览时长等。还是以用户对项目的评分举例,构建项目-用户行为矩阵如下表2.2:
本文编号:3477410
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
基于内容的推荐算法示意图
第二章推荐算法及相关概念介绍9图2.2基于用户的协同过滤黑色实线表示用户对该内容感兴趣,黑色虚线则表示系统将该内容推荐给某用户。如上图所示,用户A喜欢内容1,内容4;用户C则对内容1,内容2,内容4。从这些用户的历史行为数据中,可以得出用户A和用户C的具有相似的喜好,由此可以推断出用户A可能对内容2也会感兴趣,所以我们可以把内容2推荐给用户A。传统的UserCF的实现过程可以分为以下三个步骤:(1)首先,根据用户与系统的交互行为,可建立用户-项目评分矩阵。用户的历史行为数据会有很多种,包括:对内容的评分,浏览历史,收藏夹,点赞等,本文通过用户对项目的评分数据进行举例说明,来介绍UserCF算法的计算过程,用户-项目评分矩阵如下表2.1:表2.1用户-项目评分矩阵项目1项目2项目3项目4用户A3004用户B0050用户C3403(2)通过上述的用户-项目评分矩阵中用户对项目的评分数据,再结合上述的相似度计算方式,确定偏好相似的用户集,常用的相似度计算方法已经在本文的2.2.1章节给出了详细介绍。(3)根据用户的相似度,可以得出目标用户的最近邻居KNN,推荐给目标用
第二章推荐算法及相关概念介绍10户。KNN筛选的常用方式有两种:第一种是通过设置用户相似度的阈值,相似度大于该阈值,我们认为两用户为兴趣相似用户,否则,认为两用户不是兴趣相似用户,通过设置阈值过滤掉不相关的用户群;第二种,是通过找到Top-N的用户,得到“邻居”用户群,这种方法,是通过对相似度的值进行排序,从高到低取N个邻居用户。根据具体情况可以选择合适的策略得到最近邻居KNN。2.1.2.2基于项目的协同过滤基于项目(Item)的协同过滤,主要更多考虑的是项目之间的联系,通过确定相似的项目集合,再根据用户在系统中的行为信息,寻找与用户曾经购买过或者浏览过的内容,来为用户推荐用户感兴趣的内容。该算法原理如图2.3所示:图2.3基于项目的协同过滤黑色实线表示用户对该内容感兴趣,黑色虚线则表示系统将该内容推荐给某用户。如图所示,我们可以看出用户A对内容1,内容3感兴趣;用户B对内容1,内容2,内容3;用户C对内容1感兴趣。从用户的历史喜好信息中,可以得出对内容1感兴趣的用户都对内容3感兴趣,内容1和内容3具有相似性,所以系统将会把内容3推荐给用户C。基于项目(Item)的协同过滤算法的推荐过程可以分为以下三个步骤:(1)首先,根据用户的历史行为数据,构建项目-用户行为矩阵,用户的操作行为可以包括:浏览记录,收藏记录,浏览时长等。还是以用户对项目的评分举例,构建项目-用户行为矩阵如下表2.2:
本文编号:3477410
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3477410.html
最近更新
教材专著