融合用户评分和评语的贝叶斯推荐算法研究
发布时间:2019-09-09 20:01
【摘要】:随着互联网的高速发展,人类已经步入一个全新的智能化时代。由于信息的数据量正呈现指数级增长,且数据的种类日益繁多,传统的推荐系统已不能满足商家和消费者的双重需求。推荐算法的核心在于如何挖掘出更多的用户偏好信息,然后根据用户的兴趣点给出推荐。能反映用户偏好的信息除评分外,还包含伴随评分给出的评语。对评语进行语义分析可以挖掘出大量的用户偏好信息以及物品的潜在特征属性,有助于改善数据稀疏性和"冷启动"问题。本文研究的是推荐系统中的评分预测问题。本文将抽象的用户偏好融入到LDA(Latent Dirichlet Allocation)主题模型中,提出了引入用户评分和评语的贝叶斯评分预测模型。在互联网公开的数据集上做实验,证明了本文提出的理论方法能显著提高评分预测的准确度。本文的主要工作和贡献有以下两点:(1)本文将LDA文档生成模型引入到协同过滤推荐算法中,用主题解释抽象的用户偏好,并由此提出了基于贝叶斯理论的评分生成模型。该模型采用Gibbs采样算法对可观测到的样本信息进行参数估计。对于给定的用户和物品,该模型可预测出用户对物品的评分值。在MovieLens数据集上做实验,实验结果证明本文提出的评分预测算法比Item-CF、SVD++和PLSA-CF等传统算法的评分预测准确度更高。(2)为了挖掘更多的用户偏好信息,本文对伴随评分生成的评语信息进行了语义分析,模拟了评语中每个词的生成过程。本文提出了融合用户评分和评语的贝叶斯评分预测模型,并建立了基于LSTM的文本情感分析模型,对评语进行情感分析,解决了评分和评语不一致问题。(3)在京东商城的23个数据集上进行实验,证明了本文算法的评分预测准确度得到了显著的提高。最后,本文论证了该推荐算法具备较好的可解释性,且对椎荐系统的冷启动问题以及数据稀疏性问题有一定的改善。
【图文】:
逦喜欢逡逑整个过程可用图2-1描述。逡逑逦逡逑用户A逡逑用户A逦/逦\逦物品C逡逑喜欢逦,逦I逦逡逑一推荐逦逦逡逑用户A逦M物品D逡逑图2-1基于用户的推荐算法示例逡逑Figure邋2-1邋Example邋of邋user-based邋recommendation邋algorithm逡逑在相似度计算上,将一个用户对所有物品的偏好程度作为一个向量,挖掘出N逡逑个邻居用户。然后根据用户与邻居的相似度权重以及邻居对物品的偏好,在用户逡逑未涉及的商品中挖掘出系统认为用户会感兴趣的商品作为推荐列表,将推荐列表逡逑排序后呈现给用户。相似度权重的计算是基于近邻算法中的核心环节,一方面相逡逑似度权重可用于选择可信的近邻来预测评分,另一方面可以给予不同的近邻在预逡逑测中的权重。下面将介绍如何计算用户之间的相似度。逡逑为了将问题公式化,这里定义U为用户集合,I为物品集合,R为用户评分集逡逑合。另外
品A的用户都喜欢物品C。我们可以认为物品A和物品C是相似物品,那么对于逡逑用户C而言,,喜欢物品A但没接触过物品C,所以基于物品的推荐系统有理由认逡逑为用户C可能喜欢物品C,于是将物品C推荐给用户C。整个过程可用图2-2描逡逑述。逡逑Q)\ ̄ ̄ ̄ ̄ ̄ ̄物品A逡逑用户八逡逑——H邋物品8逡逑用户A逦\逡逑喜欢逦/逦逦逡逑一邋—逦-遍物品c逡逑推荐逦逦逡逑用户A逡逑图2-2基于物品的推荐算法示例逡逑Figure邋2-2邋Example邋of邋item-based邋recommendation邋algorithm逡逑从图2-2中可以看出,item-based算法与user-based算法原理类似,不同之处逡逑在于item-based算法计算邻居时使用的是物品本身而不是用户本身,即基于用户对逡逑物品的历史偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给逡逑目标用户。在计算上,将所有用户对某个物品的偏好作为一个向量,然后计算物逡逑品之间的相似度,最后根据用户的历史偏好预测出目标用户还没有涉及的物品,逡逑计算得出一个按顺序排列的物品列表作为推荐列表。逡逑在信息检索中有一种计算对象之间相似度的方法,将两个对象a和b表示成逡逑向量的形式计算两个向量之间的余弦相似度见式(2-9):逡逑T逡逑cos(A:a,邋xb)邋=邋—X^-Xb—逦(2-9)逡逑II邋心邋II邋IK邋II逡逑同理
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
本文编号:2533821
【图文】:
逦喜欢逡逑整个过程可用图2-1描述。逡逑逦逡逑用户A逡逑用户A逦/逦\逦物品C逡逑喜欢逦,逦I逦逡逑一推荐逦逦逡逑用户A逦M物品D逡逑图2-1基于用户的推荐算法示例逡逑Figure邋2-1邋Example邋of邋user-based邋recommendation邋algorithm逡逑在相似度计算上,将一个用户对所有物品的偏好程度作为一个向量,挖掘出N逡逑个邻居用户。然后根据用户与邻居的相似度权重以及邻居对物品的偏好,在用户逡逑未涉及的商品中挖掘出系统认为用户会感兴趣的商品作为推荐列表,将推荐列表逡逑排序后呈现给用户。相似度权重的计算是基于近邻算法中的核心环节,一方面相逡逑似度权重可用于选择可信的近邻来预测评分,另一方面可以给予不同的近邻在预逡逑测中的权重。下面将介绍如何计算用户之间的相似度。逡逑为了将问题公式化,这里定义U为用户集合,I为物品集合,R为用户评分集逡逑合。另外
品A的用户都喜欢物品C。我们可以认为物品A和物品C是相似物品,那么对于逡逑用户C而言,,喜欢物品A但没接触过物品C,所以基于物品的推荐系统有理由认逡逑为用户C可能喜欢物品C,于是将物品C推荐给用户C。整个过程可用图2-2描逡逑述。逡逑Q)\ ̄ ̄ ̄ ̄ ̄ ̄物品A逡逑用户八逡逑——H邋物品8逡逑用户A逦\逡逑喜欢逦/逦逦逡逑一邋—逦-遍物品c逡逑推荐逦逦逡逑用户A逡逑图2-2基于物品的推荐算法示例逡逑Figure邋2-2邋Example邋of邋item-based邋recommendation邋algorithm逡逑从图2-2中可以看出,item-based算法与user-based算法原理类似,不同之处逡逑在于item-based算法计算邻居时使用的是物品本身而不是用户本身,即基于用户对逡逑物品的历史偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给逡逑目标用户。在计算上,将所有用户对某个物品的偏好作为一个向量,然后计算物逡逑品之间的相似度,最后根据用户的历史偏好预测出目标用户还没有涉及的物品,逡逑计算得出一个按顺序排列的物品列表作为推荐列表。逡逑在信息检索中有一种计算对象之间相似度的方法,将两个对象a和b表示成逡逑向量的形式计算两个向量之间的余弦相似度见式(2-9):逡逑T逡逑cos(A:a,邋xb)邋=邋—X^-Xb—逦(2-9)逡逑II邋心邋II邋IK邋II逡逑同理
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【参考文献】
相关期刊论文 前5条
1 冷亚军;陆青;梁昌勇;;协同过滤推荐技术综述[J];模式识别与人工智能;2014年08期
2 吴成超;王卫平;;考虑用户兴趣变化的概率隐语意协同推荐算法[J];计算机系统应用;2014年05期
3 张瑶;陈维斌;傅顺开;;协同过滤推荐研究综述[J];微型机与应用;2013年06期
4 孙冬婷;何涛;张福海;;推荐系统中的冷启动问题研究综述[J];计算机与现代化;2012年05期
5 李文波;孙乐;张大鲲;;基于Labeled-LDA模型的文本分类新算法[J];计算机学报;2008年04期
相关硕士学位论文 前7条
1 吴庭;基于位置的推荐计算:Spark实现[D];浙江大学;2016年
2 栗波;音乐电台推荐系统的设计与实现[D];哈尔滨工业大学;2015年
3 李杨曦;基于图模型的视频推荐算法研究及实现[D];电子科技大学;2015年
4 侯成文;基于内容的邮箱广告推荐系统[D];北京邮电大学;2015年
5 段准;基于内容的自适应推荐系统研究[D];上海交通大学;2015年
6 曹一鸣;基于协同过滤的个性化新闻推荐系统的研究与实现[D];北京邮电大学;2013年
7 牛贺;基于PLSA模型的推荐算法研究与实现[D];东北大学;2012年
本文编号:2533821
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2533821.html