基于图嵌入技术的个人推荐与群组推荐算法研究
发布时间:2021-08-01 06:37
推荐系统是近十年来非常热门的研究方向。而近年来表示学习技术的迅猛发展,也大大推动了推荐系统技术的进步。在本文的研究中,我们主要探究了如何将一种新的表示学习技术,图嵌入技术分别应用到两个常见的推荐问题上:即面向个人用户的物品或朋友推荐,和面向群组用户的物品推荐。传统的面向个人用户的推荐主要采取协同过滤算法,然而协同过滤主要面临三个挑战性问题:(1)数据稀疏性问题;(2)推荐效率问题;(3)用户决策的复杂性,即社交网络平台中用户选择物品不仅考虑自身兴趣,还会参考朋友的选择。反之,用户选择朋友也同样会考虑用户与物品间的交互关系。针对以上问题,本文提出了不同场景下两种面向个人的推荐算法。针对问题(1)和(2),本文提出了一种高效的自适应混合协同物品推荐算法。该算法利用计算内容张量相似度的方法得到基于内容的推荐结果作为辅助信息,从而缓解数据稀疏性问题;同时,为了提高效率,本文采用了一种图上的短路径枚举叠加算法;最后,采用自适应的混合方法融合以上两种方法的推荐结果,提高推荐性能。另外,针对问题(1)和(3),本文提出了基于图嵌入技术的面向个人的联合用户和物品推荐算法。该算法利用用户物品交互图和用户...
【文章来源】:苏州大学江苏省 211工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图3-1?AHCF算法框架图??
基于图嵌入技术的个人推荐与群组推荐算法研宄?第二章基于自适应混合协同过滤的高效物品推?f:算法??的邻接物品标签对,可以认为共享物品和标签的二元组信息的用户是更相似的,这??种方法很大程度上去除了大量偶然相关用户,为用户找到兴趣更相关的用户。这种??情况下路径得分计算与基本扩展一样,也是终点物品的评分。假设用户通过二元??组<?>找到用户计算用户的历史物品得分为:??S?p(iii,<Vf,rm>,iij,\,n)?=?Pv”。??图3-3以基本扩展模型为例描述了短路径枚举方法的计算示意图,4代表用户与??物品标签的邻接矩阵,对于用户与物品或标签有交互的位置设置为1,没有交互的设??置为0,?代表A的转置。P是用户与物品的交互矩阵,其中的物品得分都是该列物??品的正面率。矩阵相乘之后即为最终的预测矩阵見??图3-3短路径枚举算法说明图??时间复杂度分析:对于传统的基于k近邻的协同过滤算法,在将标签作为第三类??实体的基础上,总的时间复杂度是〇((rvi+m)??丨似丨2+丨似丨?(丨切??/叹間+a:??m)),前??半部分是计算用户相似度矩阵,后半部分是对于每个用户首先找出k近邻,然后针对??每个候选物品计算得分。对于随机游走算法,其时间复杂度为〇((丨纠+?m?+?m)3.A〇,??其屮W是矩阵迭代的次数。而本章的短路径枚平算法的吋间复杂度是<9((|7|?+丨71)-??丨似丨2?+?rwi2??rvi),就是三个矩阵相乘的时间复杂度,由于现有的技术可以很方便地对??矩阵乘法并行计算,因此实际操作时效申.极高。??3.2.4算法总结??最终算法的伪代码如算法I所示。第一步,首先根据物品的内容构造张量,??Tuc
基于图嵌入技术的个人推荇与群组推荐算法研究?第二章基于自适应混合协同过滤的咼效物品推荐算法??[XZ:?UserKNN??12'?^?\ZZ2?RW??10-?V?ctd?SP1??y?□?SP2??I:ll?R??i^L??Movielens?Oouban-Book??DataSets??图3-4协同过滤算法的运行时间对比图??品的平均记录数分别为丨00和20,可以看到当〇和/?设置为丨00和20时,准确率能达到??最高。在表3-6中,抽取总数据集80%的记录作为训练集,此时用户和物品的平均??记录数约为300和60,i」J■以看到当a和尽设置为300和60时,精确度也i」j'以达到最高。??因此,每一次在混合计算之前,首先计算当前数据集的用户与物品的平均记录数,??将a和分别设置为对应值。对于Douban-?Book也使用这种方法设置。??表3-5训练集占比20%时哕对准确度的影响??100?200?400?600??10?0.528?0.5280.527 ̄ ̄0.526?? ̄^0?0.528?0.5240.5220.518??^0?0.4970.465 ̄ ̄0.382 ̄ ̄0.315??60? ̄0.418?0.302?0.190?0.132??表3-6训练集占比80%时d叫对准确度的影响??200?300?400?600??20?0.134?0.134?0.134?0.134??40?0.232?0.231 ̄ ̄0231 ̄ ̄0.231??^600.233 ̄ ̄0.233 ̄ ̄0.232 ̄ ̄0.232??80? ̄0.233?0.233
【参考文献】:
期刊论文
[1]基于用户近邻的N维张量分解推荐算法[J]. 陈健美,孙亚军. 计算机工程. 2017(11)
[2]基于动态k近邻的SlopeOne协同过滤推荐算法[J]. 孙丽梅,李晶皎,孙焕良. 计算机科学与探索. 2011(09)
[3]通过相似度支持度优化基于K近邻的协同过滤算法[J]. 罗辛,欧阳元新,熊璋,袁满. 计算机学报. 2010(08)
[4]协同过滤在推荐系统中的应用研究[J]. 王霞,刘琴. 计算机系统应用. 2005(04)
本文编号:3315015
【文章来源】:苏州大学江苏省 211工程院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图3-1?AHCF算法框架图??
基于图嵌入技术的个人推荐与群组推荐算法研宄?第二章基于自适应混合协同过滤的高效物品推?f:算法??的邻接物品标签对,可以认为共享物品和标签的二元组信息的用户是更相似的,这??种方法很大程度上去除了大量偶然相关用户,为用户找到兴趣更相关的用户。这种??情况下路径得分计算与基本扩展一样,也是终点物品的评分。假设用户通过二元??组<?>找到用户计算用户的历史物品得分为:??S?p(iii,<Vf,rm>,iij,\,n)?=?Pv”。??图3-3以基本扩展模型为例描述了短路径枚举方法的计算示意图,4代表用户与??物品标签的邻接矩阵,对于用户与物品或标签有交互的位置设置为1,没有交互的设??置为0,?代表A的转置。P是用户与物品的交互矩阵,其中的物品得分都是该列物??品的正面率。矩阵相乘之后即为最终的预测矩阵見??图3-3短路径枚举算法说明图??时间复杂度分析:对于传统的基于k近邻的协同过滤算法,在将标签作为第三类??实体的基础上,总的时间复杂度是〇((rvi+m)??丨似丨2+丨似丨?(丨切??/叹間+a:??m)),前??半部分是计算用户相似度矩阵,后半部分是对于每个用户首先找出k近邻,然后针对??每个候选物品计算得分。对于随机游走算法,其时间复杂度为〇((丨纠+?m?+?m)3.A〇,??其屮W是矩阵迭代的次数。而本章的短路径枚平算法的吋间复杂度是<9((|7|?+丨71)-??丨似丨2?+?rwi2??rvi),就是三个矩阵相乘的时间复杂度,由于现有的技术可以很方便地对??矩阵乘法并行计算,因此实际操作时效申.极高。??3.2.4算法总结??最终算法的伪代码如算法I所示。第一步,首先根据物品的内容构造张量,??Tuc
基于图嵌入技术的个人推荇与群组推荐算法研究?第二章基于自适应混合协同过滤的咼效物品推荐算法??[XZ:?UserKNN??12'?^?\ZZ2?RW??10-?V?ctd?SP1??y?□?SP2??I:ll?R??i^L??Movielens?Oouban-Book??DataSets??图3-4协同过滤算法的运行时间对比图??品的平均记录数分别为丨00和20,可以看到当〇和/?设置为丨00和20时,准确率能达到??最高。在表3-6中,抽取总数据集80%的记录作为训练集,此时用户和物品的平均??记录数约为300和60,i」J■以看到当a和尽设置为300和60时,精确度也i」j'以达到最高。??因此,每一次在混合计算之前,首先计算当前数据集的用户与物品的平均记录数,??将a和分别设置为对应值。对于Douban-?Book也使用这种方法设置。??表3-5训练集占比20%时哕对准确度的影响??100?200?400?600??10?0.528?0.5280.527 ̄ ̄0.526?? ̄^0?0.528?0.5240.5220.518??^0?0.4970.465 ̄ ̄0.382 ̄ ̄0.315??60? ̄0.418?0.302?0.190?0.132??表3-6训练集占比80%时d叫对准确度的影响??200?300?400?600??20?0.134?0.134?0.134?0.134??40?0.232?0.231 ̄ ̄0231 ̄ ̄0.231??^600.233 ̄ ̄0.233 ̄ ̄0.232 ̄ ̄0.232??80? ̄0.233?0.233
【参考文献】:
期刊论文
[1]基于用户近邻的N维张量分解推荐算法[J]. 陈健美,孙亚军. 计算机工程. 2017(11)
[2]基于动态k近邻的SlopeOne协同过滤推荐算法[J]. 孙丽梅,李晶皎,孙焕良. 计算机科学与探索. 2011(09)
[3]通过相似度支持度优化基于K近邻的协同过滤算法[J]. 罗辛,欧阳元新,熊璋,袁满. 计算机学报. 2010(08)
[4]协同过滤在推荐系统中的应用研究[J]. 王霞,刘琴. 计算机系统应用. 2005(04)
本文编号:3315015
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3315015.html