基于用户偏好的个性化协同过滤推荐算法研究
发布时间:2021-08-14 06:06
随着信息技术的进步和发展,“信息过载”问题日益突出。该问题导致人们获取所需信息的时间和人工成本等大大增加。针对此问题,目前最有效的解决方法就是个性化推荐。协同过滤作为应用最广泛的推荐算法之一,经过大量的研究和改进,目前仍存在以下几个问题影响着推荐结果的准确性:(1)评分数据稀疏;(2)评分差异导致近邻选择不够合理;(3)难以捕获用户偏好和兴趣变化。针对上述问题,本文的主要研究工作如下:1.针对评分数据稀疏问题,目前常用的是填充解决方案,然而这些填充方法未充分考虑用户偏好和项目差异。本文对此进行了改进,提出了基于用户偏好的改进填充算法。该算法从两方面进行了改进,一是根据用户评分计算用户对不同物品属性的偏好权重和评分均值,然后使用上述结果计算填充项的值并填补矩阵。二是针对目标用户的不同,改进项目相似度计算,从而得到更合理的近邻。2.通过分析评分差异问题可知,该问题主要影响了相似度计算结果的可靠性,从而导致推荐结果的不理想。本文对此进行了改进,提出了基于用户评分差异的改进推荐算法。该算法首先采用修正余弦相似度计算将用户的评分均值作为评分准则,然后引入了用户影响因子和项目影响因子来修正了不同用...
【文章来源】:重庆邮电大学重庆市
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
三种相似度计算方法的性能对比
重庆邮电大学硕士学位论文第3章考虑用户偏好和评分差异的推荐算法44实验2:验证本文3.3.1节提出的融合用户偏好的矩阵填充算法(UserPreferenceRatingFillingAlgorithm,UPRF)的有效性。通过从训练数据中随机选出一些已评分电影作为评分缺失项,然后分别采用用户评分均值填充法(UserRatingMeanFillingAlgorithm,URA),项目评分均值填充法(ItemRatingMeanFillingAlgorithm,IRA),文献[60]提出的融合用户兴趣评分填充法(UserInterestRatingFillingAlgorithm,UIR)和本文的融合用户偏好评分填充法(UserPreferenceRatingFillingAlgorithm,UPRF)填充评分矩阵的缺失项。实验时从用户所有的已评分项目中随机抽取项目集作为为评分项目集合,在用户集合大小不同的情况下,采用以上介绍的四种方法进行填充,根据最后的填充结果计算在不同大小的用户集下的MAE值如表3.13所示,实验结果如图3.3所示。表3.13常用填充算法的MAE值比较URAIRAUIRUPRF50U1.0461.0390.9480.921100U1.0011.0380.8600.854300U0.9610.95608560.845500U0.9590.9770.8820.866allU0.9941.0010.8970.878图3.3常用填充算法的MAE比较从图3.3能够看出,随着用户集规模大小的变化,四种算法的MAE都刚开始都逐步下降,然后再慢慢上升。这是因为用户集合的大小都需要在一个合适的范围内,用户集合规模偏小会使填充数值与真实值之间的误差影响被放大,导致推荐结
重庆邮电大学硕士学位论文第3章考虑用户偏好和评分差异的推荐算法45果的精度受到影响;其次,用户集合规模偏大又会出现数据稀疏问题,虽然采用UPB算法对评分进行填充可以缓解由数据稀疏导致的近邻查找不准确的问题,但UPB算法并不会对所有未评分项目进行填充,仅填充符合条件的未评分项。随着用户集合变大,评分矩阵的稠密度会有所下降,因此会引起一定的误差从而导致推荐结果的准确度略有降低。用户集合过大或过小都影响推荐精度。即便如此,在用户集合大小不同的情况下,采取本文的UPB算法填充评分缺失项的MAE值都比其他三种填充方法小,准确度平均提升了8.82%。说明在填充用户评分缺失项时考虑用户的偏好可以获得更好的推荐。实验3:验证本文第三章提出的两种改进算法,UPB算法和RDB算法的有效性。首先将近邻数分别设置为10、20、30、40、50、60、70、80、90,分别采用传统的UBCF算法、IBCF算法、以及本文提出的UPB算法和RDB算法进行实验,根据结果计算采用这四种算法的MAE值,其结果如图3.4所示。图3.4UPB和RDB改进算法性能比较图3.4的实验结果证明了本文提出的UPB、RDB算法的可行性和有效性。UBCF与UPB的结果进行对比可以看出,UPB算法与UBCF算法相比,推荐精确度平均提升了4.75%;UBCF与RDB的结果进行对比可以看出,RDB算法与UBCF算法相比,推荐精确度提升了6%~9.1%;IBCF与UPB的结果进行对比可以看出,
【参考文献】:
期刊论文
[1]融合用户兴趣和评分差异的协同过滤推荐算法[J]. 陆航,师智斌,刘忠宝. 计算机工程与应用. 2020(07)
[2]基于用户兴趣评分填充的改进混合推荐方法[J]. 李征,段垒. 工程科学与技术. 2019(01)
[3]An Improved Hybrid Collaborative Filtering Algorithm Based on Tags and Time Factor[J]. Chunxia Zhang,Ming Yang,Jing Lv,Wanqi Yang. Big Data Mining and Analytics. 2018(02)
[4]改进的基于用户的协同过滤算法[J]. 张世显,李平. 长春理工大学学报(自然科学版). 2017(06)
[5]基于商品属性值和用户特征的协同过滤推荐算法[J]. 高长元,黄凯,王京,张树臣. 计算机工程与科学. 2017(12)
[6]结合非负矩阵填充及子集划分的协同推荐算法[J]. 袁卫华,王红,杜向华. 小型微型计算机系统. 2017(12)
[7]基于相似性填充和信任因子的协同过滤算法[J]. 王建芳,谷振鹏,刘冉东,刘永利. 计算机应用与软件. 2017(10)
[8]融合项目聚类和时间权重的动态协同过滤算法[J]. 吴佳炜,沈玲玲,钱钢. 南京师范大学学报(工程技术版). 2017(03)
[9]基于用户兴趣变化的隐语义协同过滤算法[J]. 汪佩,梁立,甘健侯. 云南师范大学学报(自然科学版). 2017(04)
[10]一种SVD和信任因子相结合的协同过滤算法[J]. 王建芳,李骁,武文琪,刘永利. 小型微型计算机系统. 2017(06)
硕士论文
[1]推荐算法中冷启动问题的研究与实现[D]. 刘璐.北京邮电大学 2019
[2]基于协同过滤的推荐算法研究[D]. 潘涛涛.解放军信息工程大学 2017
[3]个性化推荐中协同过滤算法研究[D]. 路春霞.北京交通大学 2016
本文编号:3341921
【文章来源】:重庆邮电大学重庆市
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
三种相似度计算方法的性能对比
重庆邮电大学硕士学位论文第3章考虑用户偏好和评分差异的推荐算法44实验2:验证本文3.3.1节提出的融合用户偏好的矩阵填充算法(UserPreferenceRatingFillingAlgorithm,UPRF)的有效性。通过从训练数据中随机选出一些已评分电影作为评分缺失项,然后分别采用用户评分均值填充法(UserRatingMeanFillingAlgorithm,URA),项目评分均值填充法(ItemRatingMeanFillingAlgorithm,IRA),文献[60]提出的融合用户兴趣评分填充法(UserInterestRatingFillingAlgorithm,UIR)和本文的融合用户偏好评分填充法(UserPreferenceRatingFillingAlgorithm,UPRF)填充评分矩阵的缺失项。实验时从用户所有的已评分项目中随机抽取项目集作为为评分项目集合,在用户集合大小不同的情况下,采用以上介绍的四种方法进行填充,根据最后的填充结果计算在不同大小的用户集下的MAE值如表3.13所示,实验结果如图3.3所示。表3.13常用填充算法的MAE值比较URAIRAUIRUPRF50U1.0461.0390.9480.921100U1.0011.0380.8600.854300U0.9610.95608560.845500U0.9590.9770.8820.866allU0.9941.0010.8970.878图3.3常用填充算法的MAE比较从图3.3能够看出,随着用户集规模大小的变化,四种算法的MAE都刚开始都逐步下降,然后再慢慢上升。这是因为用户集合的大小都需要在一个合适的范围内,用户集合规模偏小会使填充数值与真实值之间的误差影响被放大,导致推荐结
重庆邮电大学硕士学位论文第3章考虑用户偏好和评分差异的推荐算法45果的精度受到影响;其次,用户集合规模偏大又会出现数据稀疏问题,虽然采用UPB算法对评分进行填充可以缓解由数据稀疏导致的近邻查找不准确的问题,但UPB算法并不会对所有未评分项目进行填充,仅填充符合条件的未评分项。随着用户集合变大,评分矩阵的稠密度会有所下降,因此会引起一定的误差从而导致推荐结果的准确度略有降低。用户集合过大或过小都影响推荐精度。即便如此,在用户集合大小不同的情况下,采取本文的UPB算法填充评分缺失项的MAE值都比其他三种填充方法小,准确度平均提升了8.82%。说明在填充用户评分缺失项时考虑用户的偏好可以获得更好的推荐。实验3:验证本文第三章提出的两种改进算法,UPB算法和RDB算法的有效性。首先将近邻数分别设置为10、20、30、40、50、60、70、80、90,分别采用传统的UBCF算法、IBCF算法、以及本文提出的UPB算法和RDB算法进行实验,根据结果计算采用这四种算法的MAE值,其结果如图3.4所示。图3.4UPB和RDB改进算法性能比较图3.4的实验结果证明了本文提出的UPB、RDB算法的可行性和有效性。UBCF与UPB的结果进行对比可以看出,UPB算法与UBCF算法相比,推荐精确度平均提升了4.75%;UBCF与RDB的结果进行对比可以看出,RDB算法与UBCF算法相比,推荐精确度提升了6%~9.1%;IBCF与UPB的结果进行对比可以看出,
【参考文献】:
期刊论文
[1]融合用户兴趣和评分差异的协同过滤推荐算法[J]. 陆航,师智斌,刘忠宝. 计算机工程与应用. 2020(07)
[2]基于用户兴趣评分填充的改进混合推荐方法[J]. 李征,段垒. 工程科学与技术. 2019(01)
[3]An Improved Hybrid Collaborative Filtering Algorithm Based on Tags and Time Factor[J]. Chunxia Zhang,Ming Yang,Jing Lv,Wanqi Yang. Big Data Mining and Analytics. 2018(02)
[4]改进的基于用户的协同过滤算法[J]. 张世显,李平. 长春理工大学学报(自然科学版). 2017(06)
[5]基于商品属性值和用户特征的协同过滤推荐算法[J]. 高长元,黄凯,王京,张树臣. 计算机工程与科学. 2017(12)
[6]结合非负矩阵填充及子集划分的协同推荐算法[J]. 袁卫华,王红,杜向华. 小型微型计算机系统. 2017(12)
[7]基于相似性填充和信任因子的协同过滤算法[J]. 王建芳,谷振鹏,刘冉东,刘永利. 计算机应用与软件. 2017(10)
[8]融合项目聚类和时间权重的动态协同过滤算法[J]. 吴佳炜,沈玲玲,钱钢. 南京师范大学学报(工程技术版). 2017(03)
[9]基于用户兴趣变化的隐语义协同过滤算法[J]. 汪佩,梁立,甘健侯. 云南师范大学学报(自然科学版). 2017(04)
[10]一种SVD和信任因子相结合的协同过滤算法[J]. 王建芳,李骁,武文琪,刘永利. 小型微型计算机系统. 2017(06)
硕士论文
[1]推荐算法中冷启动问题的研究与实现[D]. 刘璐.北京邮电大学 2019
[2]基于协同过滤的推荐算法研究[D]. 潘涛涛.解放军信息工程大学 2017
[3]个性化推荐中协同过滤算法研究[D]. 路春霞.北京交通大学 2016
本文编号:3341921
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3341921.html
最近更新
教材专著