基于项目特征和排序学习的新闻推荐系统设计与实现
发布时间:2021-06-13 00:51
随着互联网的逐渐普及,如今在线阅读新闻已成为我们日常生活重要的一部分。然而,在互联网海量信息面前,人们却往往变得无所适从。作为一种有效应对“信息过载”问题的手段,推荐系统在工业界和学术界均得到了广泛的研究。本文针对新闻领域的推荐方法进行了研究。主要研究工作有:(1)分析现有流行度预测算法,并通过挖掘新闻的特征,提出一种改进的新闻流行度预测方法,使用多种聚类算法将新闻进行聚类后,基于相同类别新闻的时间序列进行预测,并在此基础上对非个性化推荐算法进行改进;(2)根据用户的访问行为,使用循环神经网络获取用户的兴趣特征,并考虑获取用户数据之后,在对用户特征更新的同时,针对特定的用户更新文章的特征表示,最终通过用户特征与文章特征生成推荐列表;(3)基于预测所得流行度提出一种改进协同过滤的推荐方法,并结合(2)以及多种推荐算法,针对top-N推荐问题,使用排序学习方法融合推荐结果,提出一种基于排序学习的混合推荐算法,对推荐结果进行改进。在公开数据集上进行实验测试,结果表明该算法有更好的推荐性能;(4)基于以上提出的算法设计并实现了基于项目特征和排序学习的新闻推荐系统,考虑用户习惯并有效应对用户的冷...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
图2-1新闻生命周期及数据采集实例??
闻的流行度连续预测会有较大的随机性。但是我们使用基于时间序行度预测方法可以对这两类新闻均产生较好的预测结果。?????nes?data?-^?article?sertes?dato?一??(a)id:?186578067?(b)id:?186434651??图2-3基于时间序列糢型的方法??比实验做比较,我们提取与ML模型预测方法中的测试集相同数分别计算基于时间序列预测的方法、使用新闻项目特征聚类的流行基于时间序列聚类的流行度预测方法计算并输出最终评价指标,考行度预测的影响,我们将实验中新闻的聚类个数k选定为9。如
?tin?sm??图2-5基于时序列聚类的流行度预测方法图2-6基于新闻特征聚类的流行度预测方法??表2-2?实验结果??方沣名矜?均方根误差?平均绝对误差 ̄?????RMSE?MAE???Multivariable-linear?3.149?1.083??Time-series-forecasting-based?3.203?1.059??Article-features-cluster-?i?i\q?\?〇?7??forecasting-based??Time-Serial-cluster-?K979?1.027???iorecastmg-based???值得注意的是,在我们的数据集上使用RMSE与MAE评价指标,ML模型??预测方法相比于基于时间序列的预测方法有略好的效果。对于ML模型我们使用??不同时间序列的分段度量作为流行度特征,将数据集按8:2的比例随机划分为测??试集和训练集,训练所得参数在测试集上进行测试可得时间结果如图2-4所示,??可以较为准确预测流行度的预测值。为便于展示实验结果,我们将基于时间序列??的新闻流行度预测方法和ML模型方法进行放在一张图之中(图2-4),其中橙色??的线条表示ML模型的预测结果,青色的线条表示使用时间序列获取的结果。直??观上来看,使用ML模型方法在我们的数据集上可以取得相对较好的实验结果;??另外对于本文提出的两种改进的流行度预测方法由于实验结果比较接近
【参考文献】:
期刊论文
[1]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[2]流行度演化分析与预测综述[J]. 胡颖,胡长军,傅树深,黄建一. 电子与信息学报. 2017(04)
[3]基于排序学习的推荐算法研究综述[J]. 黄震华,张佳雯,田春岐,孙圣力,向阳. 软件学报. 2016(03)
[4]移动新闻推荐技术及其应用研究综述[J]. 孟祥武,陈诚,张玉洁. 计算机学报. 2016(04)
[5]一种融合项目特征和移动用户信任关系的推荐算法[J]. 胡勋,孟祥武,张玉洁,史艳翠. 软件学报. 2014(08)
本文编号:3226650
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
图2-1新闻生命周期及数据采集实例??
闻的流行度连续预测会有较大的随机性。但是我们使用基于时间序行度预测方法可以对这两类新闻均产生较好的预测结果。?????nes?data?-^?article?sertes?dato?一??(a)id:?186578067?(b)id:?186434651??图2-3基于时间序列糢型的方法??比实验做比较,我们提取与ML模型预测方法中的测试集相同数分别计算基于时间序列预测的方法、使用新闻项目特征聚类的流行基于时间序列聚类的流行度预测方法计算并输出最终评价指标,考行度预测的影响,我们将实验中新闻的聚类个数k选定为9。如
?tin?sm??图2-5基于时序列聚类的流行度预测方法图2-6基于新闻特征聚类的流行度预测方法??表2-2?实验结果??方沣名矜?均方根误差?平均绝对误差 ̄?????RMSE?MAE???Multivariable-linear?3.149?1.083??Time-series-forecasting-based?3.203?1.059??Article-features-cluster-?i?i\q?\?〇?7??forecasting-based??Time-Serial-cluster-?K979?1.027???iorecastmg-based???值得注意的是,在我们的数据集上使用RMSE与MAE评价指标,ML模型??预测方法相比于基于时间序列的预测方法有略好的效果。对于ML模型我们使用??不同时间序列的分段度量作为流行度特征,将数据集按8:2的比例随机划分为测??试集和训练集,训练所得参数在测试集上进行测试可得时间结果如图2-4所示,??可以较为准确预测流行度的预测值。为便于展示实验结果,我们将基于时间序列??的新闻流行度预测方法和ML模型方法进行放在一张图之中(图2-4),其中橙色??的线条表示ML模型的预测结果,青色的线条表示使用时间序列获取的结果。直??观上来看,使用ML模型方法在我们的数据集上可以取得相对较好的实验结果;??另外对于本文提出的两种改进的流行度预测方法由于实验结果比较接近
【参考文献】:
期刊论文
[1]基于深度学习的推荐系统研究综述[J]. 黄立威,江碧涛,吕守业,刘艳博,李德毅. 计算机学报. 2018(07)
[2]流行度演化分析与预测综述[J]. 胡颖,胡长军,傅树深,黄建一. 电子与信息学报. 2017(04)
[3]基于排序学习的推荐算法研究综述[J]. 黄震华,张佳雯,田春岐,孙圣力,向阳. 软件学报. 2016(03)
[4]移动新闻推荐技术及其应用研究综述[J]. 孟祥武,陈诚,张玉洁. 计算机学报. 2016(04)
[5]一种融合项目特征和移动用户信任关系的推荐算法[J]. 胡勋,孟祥武,张玉洁,史艳翠. 软件学报. 2014(08)
本文编号:3226650
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3226650.html