基于深度学习的混合式隐语义推荐模型研究

发布时间:2020-10-31 00:41
   现如今,随着智能设备更新速度加快,人们的生活方式和生活习惯不断发生变化,互联网已经成为人们在日常生活中获取信息最方便快捷的渠道。但是,在互联网为人们生活带来便利的同时,“信息爆炸”也随之而来。推荐系统和搜索引擎,作为两种不同的信息过滤技术,均可以有效地缓解信息过载给网络所带来的问题。与搜索引擎不同的是,推荐系统是一种隐式、主动的个性化信息过滤技术,它不需要用户的显示触发(如:主动提供检索关键词),它可以根据用户的显示评分记录和隐式浏览点击记录等历史数据作为判断依据,为目标用户缩小用户可能会感兴趣的项目规模。例如,推荐系统可以帮助内容提供方(门户网站、自媒体、商家)更好地定位潜在客户,从而为商家带来丰厚的经济利益;同时,推荐系统还可以帮助用户更加准确地发现目标商品,节省用户的信息过滤时间,提升用户对内容的满意度以及对内容提供方的忠诚度。据统计,Netflix~1的观影记录80%来自于Netflix网站的推荐系统~([1]),YouTube~2上60%的视频点击来自于YouTube的主页推荐~([2])。此外,推荐系统的应用不仅仅局限于视频网站的应用上,在我们身边,推荐系统随处可见。推荐系统可以为人们推荐商品、音乐、餐馆、工作职位、理财产品等等。可以看出,推荐系统已经成为人们生活中不可缺少的一部分。因此,对于推荐系统的核心算法进行深入地分析研究是非常有意义的,也是十分必要的。根据推荐策略及实际应用场景的不同,常用的推荐系统可以被分为三类:基于协同过滤的推荐系统、基于内容的推荐系统和混合式推荐系统。基于协同过滤的推荐系统旨在利用物品与物品、用户与用户、用户与物品间的关系进行推荐;基于内容的推荐系统则是从用户已进行反馈的内容出发,通过比对待反馈内容与已反馈内容的相似性,找到用户可能感兴趣的内容;混合式推荐系统则是将以上两个策略的优势相结合,同时考虑物品的内容信息与协同交互关系来发现更为精准的推荐内容。从模型的实际效果来看,混合式推荐系统要优于基于协同过滤的推荐系统,基于协调过滤的推荐系统要优于基于内容的推荐系统。在基于协同过滤的推荐系统中,隐语义模型(Latent Factor Model)是一类预测效果最好、应用场景最广的推荐模型。顾名思义,“隐语义”是该模型的核心,具体体现在模型可以根据用户与物品间的评分矩阵,将用户和物品映射到一个共享的隐式特征向量空间(latent vector space)中,利用隐式特征向量(latent factor vector)分别表示用户和物品,然后在隐式特征向量的基础上,对用户评分进行建模,从而完成评分预测。最后,系统可以根据预测好的评分为用户进行推荐。由于隐语义模型适用场景多、实现简单并且评分预测准确率高,因此许多推荐系统的核心思想都是以“隐语义”思想为基础。尽管隐语义模型有着上述诸多优点,但随着数据规模日益庞大,用户评分矩阵越来越稀疏,仅仅以用户物品间的评分为依据的传统隐语义模型在预测效果上受到很大程度的影响。同时,通过深入分析传统的隐语义模型的内在机制我们发现隐语义模型还存在许多可以提升的方面:1)用户的偏好是多种多样的,而传统的隐语义模型构建了一种固定的用户隐式偏好向量表示,没有将用户偏好的“个性多样化”特征考虑进来;2)除了用户物品的评分矩阵外,与推荐系统相关的公开数据集中包含着大量与物品相关的辅助信息(side-information),如物品特征的文字描述、用户对物品的文字评价和物品的图像信息等等,但是在构建物品隐式特征向量时,传统的隐语义模型并没有将这些辅助信息考虑进来;3)用户偏好与物品特征间有着紧密复杂的联系,但是传统的隐语义模型在预测用户评分时只利用了简单的内积计算(dot production)来建模用户偏好向量和物品特征向量间的交互关系。针对上述可改进的方面,本文以用户物品评分矩阵为主,融合大量辅助信息,从用户、物品以及用户物品间的关系这三个方面,结合混合推荐系统的思想,提出三种新颖有效的混合隐语义模型来缓解评分矩阵稀疏对隐语义模型的影响,同时提升隐语义模型的评分预测准确度。首先,针对隐语义模型用户偏好向量缺乏“个性多样化”问题,本文提出一种自适应性深层隐语义模型(Adaptive Deep Latent Factor Model--ADLFM)。ADLFM模型将物品文本描述与用户物品间的评分矩阵相结合,利用卷积神经网络抽取全局高阶语义特征,构造用户偏好向量及物品特征向量。同时,利用注意力机制实现一种“自适应性”用户偏好表示方法,该表示方法可以根据某一特定待评分物品对用户偏好向量进行动态构建,将注意力集中在与待评分物品相关的局部偏好上,使用户偏好的表达更加准确,进一步使评分预测更加精确;接下来,针对传统隐语义模型通常只利用单一信息源来学习物品特征向量的情况,本文提出一种基于多模态特征融合的隐语义模型(Deep Latent Factor Model with Fusion of Multi-modal Features--FLFM)。受信息检索领域中的跨模态检索(Cross-Modal Retrieval)的启发,本文设计了一个新颖的物品多模态特征融合模块,可以有效地将物品的文字描述信息与物品的图像信息进行融合,学习到更加贴切的物品特征向量,从而提高评分预测的准确率;最后,针对传统隐语义模型在对用户偏好与物品特征间的关系进行建模时过于简单的问题,本文提出一种基于层次化度量的深层隐语义模型(Deep Latent Factor Model with Hierarchical Similarity Measure--DLFM-HSM),DLFM-HSM模型将传统隐语义模型中的用户偏好向量替换为用户偏好矩阵,使得用户的偏好可以被更加全面地表示出来。通过对用户评分进行层次化建模,DLFM-HSM可以有效地区分出用户对物品不同特征的局部偏好,并放大这些局部偏好,从而将用户与物品间的关系准确刻画出来,提高评分预测的准确度。此外,与层次化建模相关的层次相似度度量方法不包含任何参数,因此不需要额外的参数训练。大量实验结果表明,本文提出的三个混合式隐语义模型可以有效地缓解数据稀疏所带来的问题,提高评分预测的准确率。
【学位单位】:吉林大学
【学位级别】:博士
【学位年份】:2020
【中图分类】:TP391.3;TP18
【部分图文】:

示意图,隐语,模型,物品


通过观察图1-1,我们发现,隐语义模型涉及四个关键因素:隐式空间特征、用户隐式特征映射、物品隐式特征映射及用户与物品间的关系建模。其中的每一个因素都关系到隐语义模型效果的优劣。基于矩阵分解的协同过滤方法[12]是一种最简单的隐语义模型,同时也是其他隐语义模型的思想基础和方法基础。它首先将用户和物品间的显示评分(explicit ratings)构造成一个评分矩阵,然后对评分矩阵分解,得到两个低秩矩阵,分别用来表示用户隐式特征和物品隐式特征,然后再利用矩阵乘积对矩阵中的缺失评分进行预测。实验结果表明,与其他的协同过滤方式相比,在评分预测任务上,基于矩阵分解的协同过滤有着更好的准确性。但是,通过观察整体流程,我们发现隐语义模型面临以下四个挑战:1)用户隐式特征个性化挑战:在现有的基于矩阵分解的隐语义模型中,用户的隐式特征向量表示通常是固定的。从实际意义的角度来解释,用户的隐式特征向量表示的是用户对全部特征的偏好程度。但是,用户在面对不同的物品时,他所关注的侧重点自然不同。因此,如果能够将用户对与目标物品相关的物品特征的偏好进行局部放大,则能够更好地刻画出用户对某一特定物品的偏好程度。我们将这个问题称为用户隐式特征的“个性多样化问题”。如何解决该问题是本文要面临的第一个挑战;

实例图,物品,元信息,数据集中


2)物品隐式特征向量单一性:图1-2为Amazon5公共数据集中关于物品的元信息(meta-information),图1-3为Amazon用户对物品的某一条评价实例。通过实际数据集我们发现,关于某一个物品的辅助信息(side information)是非常丰富的,包括文字描述、图片、物品类别等等。由于以上这些辅助信息属于模态不同的信息,现有的隐语义模型通常只是利用评分或者其中一种单一模态的信息来进行建模,因此在很大程度上限制了物品隐式特征的表达能力。我们将该问题称为“物品隐式特征表达单一性问题”,如何解决该问题是我们要解决的第二个挑战;图1-3 Amazon数据集中评论信息等描述实例

实例图,数据集中,实例,物品


图1-2 Amazon数据集中物品元信息等描述实例3)用户与物品间关系建模:隐语义模型通常利用两个低维矩阵相乘的方式来预测用户对尚未评分物品的可能评分。从计算机制来看,根据矩阵相乘的原理,评分预测过程可以看作是用户隐式特征向量与物品隐式特征向量之间的内积运算;从实际意义来分析,评分预测过程可以被看作是用户偏好(preference)与物品客观属性(property)在各个的隐式特征维度上交互强度(interaction)的整合,是对用户和物品间的关系进行建模。通过对计算机制进行深入分析之后,我们发现现有的大部分隐语义模型在对用户与物品间的关系进行建模时,通常只是采用简单的内积计算方法。因此如何有效地对用户与物品间的交互关系进行建模是我们所要面临的第三个挑战;
【相似文献】

相关期刊论文 前10条

1 张玉连;袁伟;;隐语义模型下的科技论文推荐[J];计算机应用与软件;2015年02期

2 孙艳;朱玉全;陈耿;;基于隐语义模型的协同过滤图书推荐方法[J];信息技术;2015年11期

3 边文龙;黄晓霞;;融合隐语义模型的聚类协同过滤[J];微型机与应用;2015年15期

4 李琳娜;江雪琴;;推荐系统中的隐语义模型研究[J];情报工程;2016年04期

5 薛琳兰;;基于隐语义模型的电商推荐系统的设计与实现[J];数字通信世界;2020年07期

6 陈永锋;朱振宇;;综合隐语义模型和信任关系网络的个性化推荐[J];科技创新与应用;2017年03期

7 纪丙全;颜建冈;;运用语义模型 解答化学实验题[J];教育与装备研究;2019年08期

8 金辰浩;;基于互联网大数据的设计语义模型[J];工业设计;2017年10期

9 赵正利;王国宇;籍芳;;一种基于相关反馈的图像内在语义模型[J];微计算机信息;2007年24期

10 李大强;关于动态的真理语义模型[J];科学技术与辩证法;2001年03期


相关博士学位论文 前10条

1 韩佳育;基于深度学习的混合式隐语义推荐模型研究[D];吉林大学;2020年

2 石俊飞;基于层次语义模型与散射机理的极化SAR地物分类[D];西安电子科技大学;2016年

3 万毅;循证医学证据评价的语义模型与应用研究[D];第四军医大学;2009年

4 王彬;基于实时语义模型的模型转换及语义一致性研究[D];昆明理工大学;2011年

5 李学宁;现代汉语形容词概念语义模型研究[D];上海交通大学;2008年

6 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年

7 杨静;UML模型的语义模型[D];贵州大学;2006年

8 李晓建;基于语义的个性化资源推荐系统中关键技术研究[D];武汉大学;2010年

9 吴明晖;面向服务的语义模型驱动企业应用软件开发方法及关键技术研究[D];浙江大学;2011年

10 牟冬梅;数字图书馆知识组织语义互联策略及其应用研究[D];吉林大学;2009年


相关硕士学位论文 前10条

1 范玉强;基于隐语义模型的推荐系统研究[D];贵州大学;2016年

2 巫可;基于隐语义模型的个性化推荐算法的研究[D];广东工业大学;2016年

3 杜春河;大数据环境下隐语义模型推荐算法的改进与实现[D];华南理工大学;2017年

4 陈晓云;基于协同过滤和隐语义模型的个性化推荐系统的研究[D];上海交通大学;2018年

5 陈文悦;基于地质语义模型和机器学习的成矿远景区预测[D];中国地质大学(北京);2019年

6 徐启东;基于隐语义模型的个性化推荐系统研究[D];广东工业大学;2019年

7 刘彼洋;基于多粒度潜语义模型和子模最大化的新闻摘要研究[D];武汉大学;2017年

8 陈博文;基于隐语义模型的混合推荐模型研究[D];兰州大学;2019年

9 周川畅;基于深度学习与隐语义模型的推荐算法研究与实现[D];中央民族大学;2019年

10 喻鑫;医学文献诊疗风险语句的语义模型与提取[D];中国科学院大学(中国科学院重庆绿色智能技术研究院);2017年



本文编号:2863222

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2863222.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4b656***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com