基于评论文本的推荐算法研究
发布时间:2021-01-20 06:51
推荐系统的评论文本作为用户问题、建议、态度的载体,对挖掘用户偏好极具价值。深度协同神经网络DeepCoNN,转换网络TransNets和神经评分回归贴士生成模型NRT等均使用评论文本来预测用户偏好,TransNets和NRT还使用评论为用户提供解释文本。但上述模型没有区分评论的重要程度,导致不重要的评论形成“噪音”,影响了用户偏好预测的精确度和解释文本的质量。本文提出了一种基于评论文本的多任务算法ERR,针对评论“噪音”问题,根据评论的重要程度赋予不同的权重,减轻评论“噪音”的干扰;针对推荐可解释性问题,根据用户对不同项目的评论和项目收到不同用户的评论构建一个序列到序列的推荐解释生成模型,同时使用本文提出的评论降噪方法提高生成的解释文本质量。在三个不同领域数据集上将TransNets和DeepCoNN与ERR进行预测用户偏好的对比,实验结果表明ERR的预测精确度相比二者平均提升了2.5%-5%,并且在更为稀疏的数据集上提升幅度更大;在TransNets和NRT与ERR进行生成解释文本的对比中,ERR的生成文本相似度有着约20%的平均提升,且生成的解释文本实例具有较好的概括性和可读性。
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
可解释推荐分类图
16第三章基于评论文本的推荐算法本章提出一种基于评论文本的可解释推荐算法,详细阐述了本文提出的评论降噪方法的原理,以及如何通过降噪后的评论文本提取评论特征预测偏好,并产生推荐解释,同时对欧氏距离进行改进,以更精确度量特征间关系。下文将对具体的工作进行详细介绍。3.1模型总览本文提出的算法模型关注偏好预测和解释生成,属于多任务学习算法。算法模型利用降噪后的评论文本缓解评分数据的稀疏,并使用改进后的欧氏距离来预测偏好,同时生成面向用户的解释文本。为后续方便阐述模型细节,对本文算法的任务定义如下:任务定义:用户(user)已评论个项目,项目(item)已收到个用户的评论(review),定义用户对项目(1≤≤)的评论为,项目收到用户(1≤≤)的评论为,用户对项目(1≤≤)的偏好(Rating)为,用户(1≤≤)对项目的偏好(Rating)为。从用户已有的个评论{1,2,…,}和项目已有的个评论{1,2,…,}中分别挖掘出用户和项目的特征,结合这两部分特征来预测用户对项目的偏好,同时生成对应的解释文本。图3.1ERR架构Figure3.1thearchitectureofERR整体的架构如图3.1所示,模型分为如下模块:
26(Ⅰ)Pet(差评)(Ⅱ)Music(差评)(Ⅲ)Games(差评)图4.1数据集评论高频词Figure4.1high-frequencywordsindataset4.2评价指标本文提出的算法ERR在进行评分预测任务的同时要完成解释文本生成的任务,因此本文使用的评价指标分为评分预测和文本生成两类。4.2.1评分预测评估标准本文采用均方根误差作为(RootMeanSquaredError,RMSE)作为预测用户对项目评分的评价指标。相比于均方误差(MeanSquaredError,MSE),RMSE排除了数据集中标签量纲的影响,适用范围更广[9]。RMSE的公式如(4.1)所示[15]。表示数据集中用户对项目的真实评分,表示用户对项目的预估评分。表示用户对个项目有过评分。RMSE越低,表明算法的准确度越高。RMSE=√∑()2=1(4.1)4.2.2解释生成评估标准本文采用ROUGE[77]和BLEU[28]作为解释生成的评价指标,二者都是经典的文本生成评价指标,从不同角度评估算法生成的文本和用户撰写的文本的相似度。指标越大,表明真实文本与生成文本的相似度越大。ROUGE通过计算文本间的重叠单元数来评估相似度。ROUGE-N定义如(4.2)所示[77]。
【参考文献】:
期刊论文
[1]注意力机制在深度学习中的研究进展[J]. 朱张莉,饶元,吴渊,祁江楠,张钰. 中文信息学报. 2019(06)
[2]基于信任计算和矩阵分解的推荐算法[J]. 王瑞琴,潘俊,冯建军. 模式识别与人工智能. 2018(09)
[3]融合评分矩阵与评论文本的商品推荐模型[J]. 李琳,刘锦行,孟祥福,苏畅,李鑫,钟珞. 计算机学报. 2018(07)
[4]基于朴素贝叶斯方法的协同过滤推荐算法[J]. 李大学,谢名亮,赵学斌. 计算机应用. 2010(06)
博士论文
[1]推荐系统中面向评分和文本数据挖掘的若干关键技术研究[D]. 徐原博.吉林大学 2019
[2]个性化推荐的可解释性研究[D]. 张永锋.清华大学 2016
本文编号:2988595
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
可解释推荐分类图
16第三章基于评论文本的推荐算法本章提出一种基于评论文本的可解释推荐算法,详细阐述了本文提出的评论降噪方法的原理,以及如何通过降噪后的评论文本提取评论特征预测偏好,并产生推荐解释,同时对欧氏距离进行改进,以更精确度量特征间关系。下文将对具体的工作进行详细介绍。3.1模型总览本文提出的算法模型关注偏好预测和解释生成,属于多任务学习算法。算法模型利用降噪后的评论文本缓解评分数据的稀疏,并使用改进后的欧氏距离来预测偏好,同时生成面向用户的解释文本。为后续方便阐述模型细节,对本文算法的任务定义如下:任务定义:用户(user)已评论个项目,项目(item)已收到个用户的评论(review),定义用户对项目(1≤≤)的评论为,项目收到用户(1≤≤)的评论为,用户对项目(1≤≤)的偏好(Rating)为,用户(1≤≤)对项目的偏好(Rating)为。从用户已有的个评论{1,2,…,}和项目已有的个评论{1,2,…,}中分别挖掘出用户和项目的特征,结合这两部分特征来预测用户对项目的偏好,同时生成对应的解释文本。图3.1ERR架构Figure3.1thearchitectureofERR整体的架构如图3.1所示,模型分为如下模块:
26(Ⅰ)Pet(差评)(Ⅱ)Music(差评)(Ⅲ)Games(差评)图4.1数据集评论高频词Figure4.1high-frequencywordsindataset4.2评价指标本文提出的算法ERR在进行评分预测任务的同时要完成解释文本生成的任务,因此本文使用的评价指标分为评分预测和文本生成两类。4.2.1评分预测评估标准本文采用均方根误差作为(RootMeanSquaredError,RMSE)作为预测用户对项目评分的评价指标。相比于均方误差(MeanSquaredError,MSE),RMSE排除了数据集中标签量纲的影响,适用范围更广[9]。RMSE的公式如(4.1)所示[15]。表示数据集中用户对项目的真实评分,表示用户对项目的预估评分。表示用户对个项目有过评分。RMSE越低,表明算法的准确度越高。RMSE=√∑()2=1(4.1)4.2.2解释生成评估标准本文采用ROUGE[77]和BLEU[28]作为解释生成的评价指标,二者都是经典的文本生成评价指标,从不同角度评估算法生成的文本和用户撰写的文本的相似度。指标越大,表明真实文本与生成文本的相似度越大。ROUGE通过计算文本间的重叠单元数来评估相似度。ROUGE-N定义如(4.2)所示[77]。
【参考文献】:
期刊论文
[1]注意力机制在深度学习中的研究进展[J]. 朱张莉,饶元,吴渊,祁江楠,张钰. 中文信息学报. 2019(06)
[2]基于信任计算和矩阵分解的推荐算法[J]. 王瑞琴,潘俊,冯建军. 模式识别与人工智能. 2018(09)
[3]融合评分矩阵与评论文本的商品推荐模型[J]. 李琳,刘锦行,孟祥福,苏畅,李鑫,钟珞. 计算机学报. 2018(07)
[4]基于朴素贝叶斯方法的协同过滤推荐算法[J]. 李大学,谢名亮,赵学斌. 计算机应用. 2010(06)
博士论文
[1]推荐系统中面向评分和文本数据挖掘的若干关键技术研究[D]. 徐原博.吉林大学 2019
[2]个性化推荐的可解释性研究[D]. 张永锋.清华大学 2016
本文编号:2988595
本文链接:https://www.wllwen.com/guanlilunwen/xiangmuguanli/2988595.html