基于评分矩阵和评论文本的混合推荐算法
发布时间:2021-06-30 10:25
互联网和信息技术的迅速发展,使Web上信息量以指数级别迅速增长,巨大的信息源使人们面临着严峻的信息过载问题,因而出现了能够有效应对信息过载问题的推荐系统,并已应用于各个领域。推荐系统中最常使用的基于评分数据的协同过滤算法被广泛研究与应用,但数据稀疏性问题严重制约了该模型的推荐效果,另一方面其只考虑了用户对商品的评分信息,忽视了大量可以利用的包含了更加丰富且有价值的信息资源的用户评论信息,可以构造模型挖掘评论文本中的用户和商品特征,用于推荐系统。因此为了缓解评分矩阵的稀疏性,提高推荐质量,相继提出了基于多源异构数据(评论文本、社交网络等)的推荐模型,但往往不能充分挖掘用户和商品的高阶抽象特征,而深度学习技术在挖掘高阶特征方面表现良好。因此,针对上述问题,使用深度学习技术来处理评论文本信息并结合传统推荐算法,设计并实现一个混合推荐算法具有重要的意义。本文从用户-商品评论文本入手,结合卷积神经网络,通过分析同一用户对不同商品的评论内容以判断其用户偏好并加以量化,及不同用户对同一商品的评论内容以判断其商品属性并加以量化,得到用户和商品的深层非线性特征向量,并将这部分信息与传统的基于评分矩阵的隐...
【文章来源】:河北大学河北省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
不同的潜在特征维数K对性能的影响
第五章实验验证和相关分析49之后,算法性能的提升有限,相反的,随着K的增加,会使算法训练的时间开增加,因此综合考虑当K在16时算法性能最佳。并且本文提出的HRA-MR,在不同的K下都拥有优秀的表现。(2)融合权重α对实验结果的影响设置α={0,0.1,0.2,…,1},观察其变化对RMSE和MAE值的影响如图5-2所示:(a)α对RMSE的影响(b)α对MAE的影响图5-2不同的混合权重α对性能的影响从图中可以看出不同的α取值对算法性能的影响,当α取值从0逐渐增长到1的过程中,RMSE指标呈现了先减少后增加的趋势,并且当α的取值在0.6附近时,RMSE取得了最小值,这时算法的性能最佳。(3)隐藏层数H对实验结果的影响我们设置隐藏层数为{1,2,3,4,5},观察其变化对RMSE值的影响如图5-3所示:(a)H对RMSE的影响
河北大学硕士学位论文50(b)H对MAE的影响图5-3不同的隐藏层数H对性能的影响从图5-3中可以看出,随着神经网络层数的增加,RMSE和MAE两个指标都呈现了先减少后增加的趋势,并且当隐藏层数在3附近时,RMSE和MAE都取得了最小值,这时算法的性能最佳。这说明在数据量充分的情况下,神经网络的层数增加会使用户和商品特征的交互越充分,但是随着隐藏层数量的不断增加,由于过拟合现象,性能可能会降低。(4)Dropout率对实验结果的影响我们设置Dropout率为{0.1,0.3,0.5,0.7,0.9},观察其变化对RMSE值的影响如图5-4所示:图5-4不同的Dropout率对性能的影响如图5-4,设置恰当的Dropout率可以缓解过拟合问题,提升模型性能,且Dropout率设置为0.5时,性能达到了最佳。(5)学习率δ对实验结果的影响
【参考文献】:
期刊论文
[1]一种基于用户播放行为序列的个性化视频推荐策略[J]. 王娜,何晓明,刘志强,王文君,李霞. 计算机学报. 2020(01)
[2]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[3]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[4]基于内容的推荐与协同过滤融合的新闻推荐方法[J]. 杨武,唐瑞,卢玲. 计算机应用. 2016(02)
[5]基于隐式用户反馈数据流的实时个性化推荐[J]. 王智圣,李琪,汪静,印鉴. 计算机学报. 2016(01)
[6]利用社交关系的实值条件受限玻尔兹曼机协同过滤推荐算法[J]. 何洁月,马贝. 计算机学报. 2016(01)
[7]互联网推荐系统比较研究[J]. 许海玲,吴潇,李晓东,阎保平. 软件学报. 2009(02)
本文编号:3257570
【文章来源】:河北大学河北省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
不同的潜在特征维数K对性能的影响
第五章实验验证和相关分析49之后,算法性能的提升有限,相反的,随着K的增加,会使算法训练的时间开增加,因此综合考虑当K在16时算法性能最佳。并且本文提出的HRA-MR,在不同的K下都拥有优秀的表现。(2)融合权重α对实验结果的影响设置α={0,0.1,0.2,…,1},观察其变化对RMSE和MAE值的影响如图5-2所示:(a)α对RMSE的影响(b)α对MAE的影响图5-2不同的混合权重α对性能的影响从图中可以看出不同的α取值对算法性能的影响,当α取值从0逐渐增长到1的过程中,RMSE指标呈现了先减少后增加的趋势,并且当α的取值在0.6附近时,RMSE取得了最小值,这时算法的性能最佳。(3)隐藏层数H对实验结果的影响我们设置隐藏层数为{1,2,3,4,5},观察其变化对RMSE值的影响如图5-3所示:(a)H对RMSE的影响
河北大学硕士学位论文50(b)H对MAE的影响图5-3不同的隐藏层数H对性能的影响从图5-3中可以看出,随着神经网络层数的增加,RMSE和MAE两个指标都呈现了先减少后增加的趋势,并且当隐藏层数在3附近时,RMSE和MAE都取得了最小值,这时算法的性能最佳。这说明在数据量充分的情况下,神经网络的层数增加会使用户和商品特征的交互越充分,但是随着隐藏层数量的不断增加,由于过拟合现象,性能可能会降低。(4)Dropout率对实验结果的影响我们设置Dropout率为{0.1,0.3,0.5,0.7,0.9},观察其变化对RMSE值的影响如图5-4所示:图5-4不同的Dropout率对性能的影响如图5-4,设置恰当的Dropout率可以缓解过拟合问题,提升模型性能,且Dropout率设置为0.5时,性能达到了最佳。(5)学习率δ对实验结果的影响
【参考文献】:
期刊论文
[1]一种基于用户播放行为序列的个性化视频推荐策略[J]. 王娜,何晓明,刘志强,王文君,李霞. 计算机学报. 2020(01)
[2]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[3]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[4]基于内容的推荐与协同过滤融合的新闻推荐方法[J]. 杨武,唐瑞,卢玲. 计算机应用. 2016(02)
[5]基于隐式用户反馈数据流的实时个性化推荐[J]. 王智圣,李琪,汪静,印鉴. 计算机学报. 2016(01)
[6]利用社交关系的实值条件受限玻尔兹曼机协同过滤推荐算法[J]. 何洁月,马贝. 计算机学报. 2016(01)
[7]互联网推荐系统比较研究[J]. 许海玲,吴潇,李晓东,阎保平. 软件学报. 2009(02)
本文编号:3257570
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3257570.html
最近更新
教材专著