基于相似度优化和流形学习的协同过滤算法改进研究
发布时间:2021-03-20 09:02
协同过滤算法中存在着数据稀疏性和可扩展性问题,由于用户和项目数据量巨大致使数据十分稀疏,且不同数据集中数据存在差异,致使现有算法中的相似度计算不够准确和用户聚类效果不佳,对推荐算法准确率产生了显著影响。为了提高相似度计算和最近邻居搜索的准确率,提出了一种基于相似度优化和流形学习的协同过滤算法。通过加权因子优化相似度计算,结合流形学习对稀疏的用户评分数降维后进行谱聚类,通过获得的全局最优解提高聚类所得目标用户最近邻居的准确率,进而提高协同过滤推荐精度。在Epinions数据集和MovieLens数据集上进行实验,结果表明,提出的算法可以有效降低协同过滤算法的平均绝对误差和均方根误差,提高召回率,拥有更高的推荐准确率。
【文章来源】:计算机工程与科学. 2020,42(02)北大核心CSCD
【文章页数】:7 页
【部分图文】:
MLCF+算法流程图
实验1 在Epinions数据集上, Κ∈[ 0,200 ] 时传统CF算法、MLCF算法和MLCF+算法的平均绝对误差MAE和均方根误差RMSE对比如图2和图3所示。从图2和图3可以看出,在Epinions数据集上,随着K值的增大,3种算法的MAE值和RMSE值均呈先快速下降后逐渐平稳的趋势。其中,MLCF算法相对传统CF算法,MAE和RMSE均有降低,准确率得到了提高。与此同时,优化相似度的MLCF+算法比不优化相似度的MLCF算法的MAE和RMSE更低,准确率最高。图3 在Epinions数据集上不同算法的RMSE对比
图2 在Epinions数据集上不同算法的MAE对比实验2 在MovieLens数据集上, Κ∈[ 0,200 ] 时传统CF算法、MLCF算法和MLCF+算法的平均绝对误差MAE和均方根误差RMSE对比如图4和图5所示。
【参考文献】:
期刊论文
[1]两阶段联合聚类协同过滤算法[J]. 吴湖,王永吉,王哲,王秀利,杜栓柱. 软件学报. 2010(05)
[2]协同过滤推荐算法综述[J]. 马宏伟,张光卫,李鹏. 小型微型计算机系统. 2009(07)
[3]互联网推荐系统比较研究[J]. 许海玲,吴潇,李晓东,阎保平. 软件学报. 2009(02)
博士论文
[1]基于流形学习的分类与聚类方法及其应用研究[D]. 王勇.国防科学技术大学 2011
本文编号:3090740
【文章来源】:计算机工程与科学. 2020,42(02)北大核心CSCD
【文章页数】:7 页
【部分图文】:
MLCF+算法流程图
实验1 在Epinions数据集上, Κ∈[ 0,200 ] 时传统CF算法、MLCF算法和MLCF+算法的平均绝对误差MAE和均方根误差RMSE对比如图2和图3所示。从图2和图3可以看出,在Epinions数据集上,随着K值的增大,3种算法的MAE值和RMSE值均呈先快速下降后逐渐平稳的趋势。其中,MLCF算法相对传统CF算法,MAE和RMSE均有降低,准确率得到了提高。与此同时,优化相似度的MLCF+算法比不优化相似度的MLCF算法的MAE和RMSE更低,准确率最高。图3 在Epinions数据集上不同算法的RMSE对比
图2 在Epinions数据集上不同算法的MAE对比实验2 在MovieLens数据集上, Κ∈[ 0,200 ] 时传统CF算法、MLCF算法和MLCF+算法的平均绝对误差MAE和均方根误差RMSE对比如图4和图5所示。
【参考文献】:
期刊论文
[1]两阶段联合聚类协同过滤算法[J]. 吴湖,王永吉,王哲,王秀利,杜栓柱. 软件学报. 2010(05)
[2]协同过滤推荐算法综述[J]. 马宏伟,张光卫,李鹏. 小型微型计算机系统. 2009(07)
[3]互联网推荐系统比较研究[J]. 许海玲,吴潇,李晓东,阎保平. 软件学报. 2009(02)
博士论文
[1]基于流形学习的分类与聚类方法及其应用研究[D]. 王勇.国防科学技术大学 2011
本文编号:3090740
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3090740.html