当前位置:主页 > 科技论文 > 软件论文 >

异质信息网络中基于表征学习的推荐算法研究

发布时间:2021-07-05 22:13
  随着互联网上信息和内容的爆炸式增长,我们进入了一个“信息过载”的时代。人们难以迅速有效地找到自己所需的内容或项目,因此推荐系统应运而生,通过对用户偏好和项目特征的建模帮助人们挖掘他们可能感兴趣的内容或项目。早期的推荐系统仅考虑了用户的历史行为,可能导致用户和项目建模产生偏差,影响推荐效果。近年来,很多研究利用用户和项目的辅助信息来提高推荐算法的性能。在现实的推荐系统中,用户、项目及其辅助信息可以看做不同类型的对象,这些对象间存在不同类型的关系(如用户对项目的购买关系,项目与其属性的所属关系),这些多种类型的对象和关系就形成了一个异质信息网络。基于异质信息网络的推荐算法由于能够自然且有效地对复杂信息进行建模,引起了人们的注意。基于异质信息网络的算法多数首先利用多条元路径从不同的角度抽取异质网络上用户和项目间的丰富语义信息,然后进行推荐。虽然已有方法取得了一定的效果提升,但大多数方法存在以下问题之一:1)他们在每条元路径上独立的抽取信息并对用户和项目进行建模,当某些元路径上的数据比较稀疏或噪音较大时,信息抽取存在误差;2)在探索异质信息网络的过程中,对用户和项目的建模目标仅是挖掘网络上的结... 

【文章来源】:北京大学北京市 211工程院校 985工程院校 教育部直属院校

【文章页数】:55 页

【学位级别】:硕士

【部分图文】:

异质信息网络中基于表征学习的推荐算法研究


神经网络图示

异质,信息网络


北京大学硕士学位论文不同的元路径下的相似性不同。基于元路径,Sun (Sun et al., 201im 方法,可以衡量两个相同类型节点在对称元路径上的相似性。性的限制,Lao 和 Cohen (Lao et al., 2010a, 2010b)提出了限定路径)方法来衡量不同类型节点在非对称元路径上的相似性。为了衡量点间的相似性关系,Shi (Shi et al., 2014)提出了 HeteSim 方法并给。在 HeteSim 的基础上,为了降低时间和空间复杂度,Meng (M利用给定元路径及其逆向路径下的两个随机游走过程衡量节点间径同样也存在问题。以图 2.2 情况为例,元路径“用户→评价→可以捕捉用户 1 和用户 2 间的语义关系,因为他们都给阿凡达写”的标签。但是如果想捕捉两个用户都给电影打了相同的标签的同评分的关系,元路径就无能为力。近两年,Fang 和 Huang(Fang al., 2016)提出了使用元结构(或元图)来表示异质信息网络中的节路径不能表示的复杂语义关系。

信息网络,学习方法,异质,邻接矩阵


图 2.3 异质信息网络中基于分解的表征学习方法基于分解的方法采用“分而治之”的思想,基于元路径、元结构等方法,将网络分解成几个简单的网络结构(如同质信息网络),再分别进行网络表征将不同简单网络上的表征融合起来,如图 2.3 所示,其中使用邻接矩阵表示网络, 表示在基于第 条元路径分解得到的同质信息网络上进行学习,得到入表示, 表示融合后节点最终的嵌入表示。同质信息网络的表征学习领域已有较多工作。DeepWalk (Perozzi et al., 2014) 的随机游走与 Skip-Gram (Mikolov et al., 2013) 结合起来,学习节点的嵌入表DeepWalk 的基础上,node2vec(Grover et al., 2016)改进了随机游走的策略,以到局部和宏观的信息。Line (Tang et al., 2015) 认为两个节点的相似性可以从和上下文相似性两个角度进行考量,并基于这两种相似性分别学习节点的表将这两类嵌入表示融合起来。除了采用网络表征学习的方法,一种比较简单的方法是采用矩阵分解的方法路径分解得到的多个同质网络可以表示成邻接矩阵,因此可以在邻接矩阵上

【参考文献】:
期刊论文
[1]一种基于元路径的异质信息网络链路预测模型[J]. 黄立威,李德毅,马于涛,郑思仪,张海粟,付鹰.  计算机学报. 2014(04)
[2]互联网推荐系统比较研究[J]. 许海玲,吴潇,李晓东,阎保平.  软件学报. 2009(02)



本文编号:3266920

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3266920.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户75038***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com