基于矩阵分解的个性化电影推荐算法研究
发布时间:2022-02-22 19:28
大数据时代背景下,随着信息的数量和种类迅速增长,使得信息需要花费大量的时间寻找,以得到感兴趣或者有用的信息,出现信息过载问题。随着个性化推荐系统的出现,信息过载问题得到了缓解。近年来出现大量推荐系统的相关研究,由于矩阵分解技术的推荐准确率高、可扩展性强、运行速度快等优点,其迅速成为推荐算法领域中的研究热点。论文基于混合推荐算法的原理改进了传统相似度计算,从距离的角度考虑推荐问题,改进了概率矩阵分解算法,基于近邻推荐算法的思想改进了贝叶斯个性化排序算法。论文首先利用兴趣漂移因子和热门物品因子通过加权方式改进了Pearson相似度,利用奇异值分解算法得到了用户隐特征矩阵,通过余弦相似度计算用户的隐特征相似度,利用Hellinger Distance分析用户之间的评分分布相似度,并且以此作为改进的Pearson相似度的权重与隐特征相似度结合,提出了基于Hellinger Distance改进相似度的协同过滤算法(CFHPI)。通过实验,分别与传统的Pearson相似度、Jaccard相似度以及NCF算法进行对比,结果表明CFHPI算法的MAE达到了0.769,比其它三种算法最少降低了0.01...
【文章来源】:哈尔滨理工大学黑龙江省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
基于用户的协同过滤概述图
哈尔滨理工大学工程硕士学位论文-9-0.25,0.67。从计算结果来看,用户D与用户C相似度最大。第三步,计算推荐结果。用户C进行评分的物品是b和e,接下来计算用户C对物品a、c、d的偏好程度分别为1.750,1.025,2.041。可以得到用户C在没有进行评分的物品中倒序排列为a、c、d。这样就可以根据需要取前K个物品推荐给用户C。基于用户的协同过滤算法适用于用户数量少于物品数量的情况,当用户数量远远大于物品数量时,这时基于用户的协同过滤的计算复杂度就增加了,而基于物品的协同过滤是对物品之间的比较,比较适合这种情况。它的核心是构建物品相似度矩阵,将用户产生过行为的每个物品与其他物品进行匹配,将匹配度最高的物品加入推荐列表。图2-2基于物品的协同过滤概述图Fig.2-2Schematicdiagramofcollaborativefilteringbasedonitem以电影为例介绍基于物品的协同过滤推荐算法,如图2-2所示,用户C喜欢电影A,电影C和电影A相似,那么便把用户C没有产生行为的电影C推荐给用户C。基于物品的协同过滤算法一般分为以下三步:第一步,构建用户电影评分矩阵。这里用户电影评分矩阵使用上表2-1。第二步,计算物品之间的相似度。物品相似度的计算仍然采用Jaccard相似度计算,公式如(2-2)。||(,)||ijijIIsimijII(2-2)iI是对电影i产生评分的用户集合,jI是对电影j产生评分的用户集合。
哈尔滨理工大学工程硕士学位论文-11-2.1.2基于内容的推荐算法推荐系统指出如何推荐与用户之前喜欢的物品相似的物品。物品的相似度取决于物品之间的特点。当用户购买或者评分信息很少的情况下,基于内容的推荐算法就能发挥它的优势了。基于内容的推荐算法能够根据用户的购买或者评分物品构建用户的偏好表示,然后与未产生行为的物品进行匹配,匹配度高的物品为用户可能喜欢的物品[55]。其中的“内容”指的便是:用户过去一段时间内喜欢的物品,以及由此推算出来的用户偏好。图2-3基于内容的推荐算法概述图Fig.2-3Schematicdiagramofcollaborativefilteringbasedoncontent如图2-3所示是一个基于内容推荐的例子,从图中可以发现用户A和用户C偏好爱情、浪漫类型的电影,用户B偏好恐怖、惊悚类的电影,因此将类型为爱情、浪漫的且用户A没有行为的电影C推荐给用户A。基于内容的推荐原理非常简单,向用户推荐喜欢的电影的相似电影。其中包含了三步:第一步,构造电影的特征,第二步,为用户构建特征表示,第三步,评判用户是否喜欢某个电影。第一步:构建电影特征矩阵。例如:《我的青春都是你》的类型为:爱情|校园|喜剧。《青春派》的类型为:爱情|校园|喜剧。《战狼2》的类型为:动作|警匪。这里假设电影类型为[爱情、喜剧、动作、枪战、警匪、校园、恐怖、悬疑]中的一种或者几种。对于算法模型来讲,这里的类型名字是没有办法直接使用的,需要将其转化成数字才能使用。将每条数据的电影类型用一维矩阵表示,则A为[0,1,1,1,0],
【参考文献】:
期刊论文
[1]融合朴素贝叶斯和协同过滤的外卖推荐并行算法研究[J]. 鲍凯丽,刘其成,牟春晓. 计算机应用与软件. 2019(11)
[2]一种改进项目多属性类别划分的推荐算法[J]. 邱宁佳,薛丽娇,贺金彪,王鹏,杨华民. 计算机应用研究. 2020(10)
[3]多重对级贝叶斯个性化排序算法[J]. 程明月,刘淇,李徵,于润龙,高维博,陈恩红. 南京信息工程大学学报(自然科学版). 2019(03)
[4]一种改进相似度的协同过滤算法[J]. 于金霞,臧利明,王俊峰,汤永利. 河南理工大学学报(自然科学版). 2019(02)
[5]基于内容的加权粒度序列推荐算法[J]. 王光,张杰民,董帅含,夏帅. 计算机工程与科学. 2018(03)
[6]多主题受限玻尔兹曼机的长尾分布推荐研究[J]. 史明哲,吴国栋,张倩,疏晴. 小型微型计算机系统. 2018(02)
[7]一种优化的带偏置概率矩阵分解算法[J]. 王建芳,张朋飞,谷振鹏,刘冉东. 小型微型计算机系统. 2017(05)
[8]融合主题模型和协同过滤的多样化移动应用推荐[J]. 黄璐,林川杰,何军,刘红岩,杜小勇. 软件学报. 2017(03)
[9]一种改进的基于用户项目喜好的相似度度量方法[J]. 雷建云,何顺,王淑娟. 中南民族大学学报(自然科学版). 2015(04)
[10]基于网络用户信息行为的个性化推荐模型[J]. 余肖生,孙珊. 重庆理工大学学报(自然科学). 2013(01)
本文编号:3640083
【文章来源】:哈尔滨理工大学黑龙江省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
基于用户的协同过滤概述图
哈尔滨理工大学工程硕士学位论文-9-0.25,0.67。从计算结果来看,用户D与用户C相似度最大。第三步,计算推荐结果。用户C进行评分的物品是b和e,接下来计算用户C对物品a、c、d的偏好程度分别为1.750,1.025,2.041。可以得到用户C在没有进行评分的物品中倒序排列为a、c、d。这样就可以根据需要取前K个物品推荐给用户C。基于用户的协同过滤算法适用于用户数量少于物品数量的情况,当用户数量远远大于物品数量时,这时基于用户的协同过滤的计算复杂度就增加了,而基于物品的协同过滤是对物品之间的比较,比较适合这种情况。它的核心是构建物品相似度矩阵,将用户产生过行为的每个物品与其他物品进行匹配,将匹配度最高的物品加入推荐列表。图2-2基于物品的协同过滤概述图Fig.2-2Schematicdiagramofcollaborativefilteringbasedonitem以电影为例介绍基于物品的协同过滤推荐算法,如图2-2所示,用户C喜欢电影A,电影C和电影A相似,那么便把用户C没有产生行为的电影C推荐给用户C。基于物品的协同过滤算法一般分为以下三步:第一步,构建用户电影评分矩阵。这里用户电影评分矩阵使用上表2-1。第二步,计算物品之间的相似度。物品相似度的计算仍然采用Jaccard相似度计算,公式如(2-2)。||(,)||ijijIIsimijII(2-2)iI是对电影i产生评分的用户集合,jI是对电影j产生评分的用户集合。
哈尔滨理工大学工程硕士学位论文-11-2.1.2基于内容的推荐算法推荐系统指出如何推荐与用户之前喜欢的物品相似的物品。物品的相似度取决于物品之间的特点。当用户购买或者评分信息很少的情况下,基于内容的推荐算法就能发挥它的优势了。基于内容的推荐算法能够根据用户的购买或者评分物品构建用户的偏好表示,然后与未产生行为的物品进行匹配,匹配度高的物品为用户可能喜欢的物品[55]。其中的“内容”指的便是:用户过去一段时间内喜欢的物品,以及由此推算出来的用户偏好。图2-3基于内容的推荐算法概述图Fig.2-3Schematicdiagramofcollaborativefilteringbasedoncontent如图2-3所示是一个基于内容推荐的例子,从图中可以发现用户A和用户C偏好爱情、浪漫类型的电影,用户B偏好恐怖、惊悚类的电影,因此将类型为爱情、浪漫的且用户A没有行为的电影C推荐给用户A。基于内容的推荐原理非常简单,向用户推荐喜欢的电影的相似电影。其中包含了三步:第一步,构造电影的特征,第二步,为用户构建特征表示,第三步,评判用户是否喜欢某个电影。第一步:构建电影特征矩阵。例如:《我的青春都是你》的类型为:爱情|校园|喜剧。《青春派》的类型为:爱情|校园|喜剧。《战狼2》的类型为:动作|警匪。这里假设电影类型为[爱情、喜剧、动作、枪战、警匪、校园、恐怖、悬疑]中的一种或者几种。对于算法模型来讲,这里的类型名字是没有办法直接使用的,需要将其转化成数字才能使用。将每条数据的电影类型用一维矩阵表示,则A为[0,1,1,1,0],
【参考文献】:
期刊论文
[1]融合朴素贝叶斯和协同过滤的外卖推荐并行算法研究[J]. 鲍凯丽,刘其成,牟春晓. 计算机应用与软件. 2019(11)
[2]一种改进项目多属性类别划分的推荐算法[J]. 邱宁佳,薛丽娇,贺金彪,王鹏,杨华民. 计算机应用研究. 2020(10)
[3]多重对级贝叶斯个性化排序算法[J]. 程明月,刘淇,李徵,于润龙,高维博,陈恩红. 南京信息工程大学学报(自然科学版). 2019(03)
[4]一种改进相似度的协同过滤算法[J]. 于金霞,臧利明,王俊峰,汤永利. 河南理工大学学报(自然科学版). 2019(02)
[5]基于内容的加权粒度序列推荐算法[J]. 王光,张杰民,董帅含,夏帅. 计算机工程与科学. 2018(03)
[6]多主题受限玻尔兹曼机的长尾分布推荐研究[J]. 史明哲,吴国栋,张倩,疏晴. 小型微型计算机系统. 2018(02)
[7]一种优化的带偏置概率矩阵分解算法[J]. 王建芳,张朋飞,谷振鹏,刘冉东. 小型微型计算机系统. 2017(05)
[8]融合主题模型和协同过滤的多样化移动应用推荐[J]. 黄璐,林川杰,何军,刘红岩,杜小勇. 软件学报. 2017(03)
[9]一种改进的基于用户项目喜好的相似度度量方法[J]. 雷建云,何顺,王淑娟. 中南民族大学学报(自然科学版). 2015(04)
[10]基于网络用户信息行为的个性化推荐模型[J]. 余肖生,孙珊. 重庆理工大学学报(自然科学). 2013(01)
本文编号:3640083
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3640083.html
最近更新
教材专著