基于评论挖掘的跨域推荐问题研究
发布时间:2018-02-13 04:13
本文关键词: 跨领域推荐 联合张量分解 细粒度偏好迁移 张量稀疏问题的缓解 出处:《山东大学》2017年硕士论文 论文类型:学位论文
【摘要】:近年来,蓬勃发展的在线商品评论网站给广大用户带来了极大便利,同时用户也留下了大量的偏好信息。在线商家通过这些偏好信息,了解用户兴趣,为其推荐商品,由此,推荐系统应运而生。推荐系统将用户表现出的偏好信息进行合理的运算,预测出用户可能喜欢的商品,供用户参考。这已被广泛应用于各大在线商品评论网站中,如Amazon,eBay,Taobao,JD.com等,取得了极大成功。然而,直到如今,新用户的冷启动问题仍然是推荐系统中的一个不可忽视的重要挑战。对此,跨领域推荐(以下简称"跨域推荐")作为一种有效的解决思路,正在引起越来越多研究者的关注。跨域推荐旨在利用知识迁移的策略,将一个相对稠密域的用户偏好迁移到相对稀疏的目标域中,用以辅助解决目标域的冷启动问题。现今的跨域推荐工作绝大多数利用的是用户对商品的评分,而实际上,评论文本之类的文本信息蕴含着更为丰富的用户偏好,这是已有工作往往所忽视的。在评论中,用户往往会表达出对商品在更细粒度上的喜恶,合理利用这些细粒度的情感偏好,将大大有助于提高跨域推荐的准确度。例如,对于一部手机,一个用户的评论可以向我们展现出他对"屏幕"的看法或者对"电池"的看法,这比仅利用评分精确得多。基于此,本文研究如何有效利用评论中的细粒度用户偏好进行跨域推荐。由于评论中的偏好信息是杂乱无章的,所以利用评论中的细粒度偏好进行跨域推荐相比仅利用评分等数据更为复杂。其中包含两个挑战:第一,如何建模用户在评论中的细粒度偏好来适应知识迁移的需要?第二,如何有效地进行基于评论的知识迁移?本文对此进行了较为深入的研究,提出了一个比较完整的解决框架,包含了一系列比较复杂的问题。具体工作和贡献概括如下:1.针对跨域框架中细粒度偏好的建模问题,本文将"方面"这一层级引入框架中,并且分别用"评价值张量"和"关注度张量"去建模用户偏好。从评论中提取用户的细粒度情感偏好,本文使用"用户-商品-方面"这种三元关系来组织。对于这种三元关系,本文使用三维张量(third-ordertensor,以下简称"张量")进行建模。在张量中,每一个元素记录某用户对某商品在某"方面"上的情感程度。这种建模方式在跨域推荐中的优势在于:第一,可以将评论中杂乱无章的用户偏好组织成便于运算的结构化数据,便于实现两域数据的对接;第二,将"方面"作为一个独立的维度,便于捕捉两个不同域中"方面"的联系,使得"方面"这一层级的作用在跨域推荐中得以充分发挥。引入"方面"层级后,为解决用户对商品在各"方面"上的情感偏好与对商品的整体偏好之间的关系问题,本文基于"一个用户对某商品在其更为关注的方面上的评价将更大地影响该用户对该商品的整体评价"这一思想,在每个域中建模"评价值张量"和"关注度张量"。2.针对细粒度知识的跨域迁移问题,本文首次提出了一种基于评论的联合张量分解模型(Review Based Joint Tensor Factorization,RB-JTF),并将其应用于跨域推荐框架中。RB-JTF模型通过将辅助域张量和目标域张量进行联合地分解来实现知识迁移。怎样通过联合地分解两个不同域的张量来跨域迁移知识这个问题在目前来说仍然没有被很好地解决,是一个重要挑战。在RB-JTF中,首先两个张量均被分解为三个因子矩阵,分别为用户,商品和"方面"的潜在特征矩阵。然后,RB-JTF的知识迁移策略包括两个部分:第一,使用户的潜在特征在辅助域和目标域中实现共享;第二,捕捉两个域中"方面"的联系并将其融入知识迁移模型,首先度量两个"方面"的语义相似度,然后根据语义相似度对"方面"的潜在特征的距离给予不同程度的约束,实现"方面"潜在特征的迁移。本文给出了 RB-JTF模型的目标函数,并且使用非线性共轭梯度法对因子矩阵进行学习,并分析了算法的时间复杂性。不同于以往的跨域推荐模型,RB-JTF预测的是"方面"这个层级的偏好,为了将预测的用户对商品各方面的评价转化为对这件商品整体的评价,本文分别在评价值张量和关注度张量上进行知识的跨域迁移。另外,针对张量的稀疏问题,本文提出了缓解策略,通过预估张量中的部分元素以及其可靠度,进一步提高联合张量分解模型的准确度。3.本文在Amazon.com数据集上验证了本文所提出的基于评论挖掘的跨域推荐框架的有效性。本文设计了两组跨域组合,分别是"电影-图书"和"电影-音乐",通过实验显示,基于评论挖掘的联合张量分解模型在RMSE和MAE两个指标上均优于各基线方法,尤其是对于目标域中的冷启动用户。此外,实验还进行了重要参数的影响分析,训练算法的迭代分析以及张量稀疏问题缓解策略效果分析等。
[Abstract]:......
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.3
【参考文献】
相关期刊论文 前2条
1 邹本友;李翠平;谭力文;陈红;王绍卿;;基于用户信任和张量分解的社会网络推荐[J];软件学报;2014年12期
2 罗浩;高升;徐蔚然;;基于个性信息的跨域推荐算法[J];软件;2013年12期
,本文编号:1507291
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1507291.html