基于表示学习的社交网络链接预测方法研究
发布时间:2021-10-30 00:09
人类活动构成了功能各异的社会团体,这些社会团体由不同的人、人与人之间错综复杂的关系组成。随着互联网与现代信息技术的飞速发展,传统的社会团体逐渐向线上转移和发展,在线社交网络已经成为承载人类活动的主要平台。作为人们日常生活的重要依赖,社交网络中节点众多,信息庞杂,且随时间不断演化,导致对其研究愈加困难。链接预测作为社交网络分析中重要的研究内容,有助于探索网络的演化机制和发展模式,评估社会现象,完善网络中的缺失信息,挖掘用户间的潜在链接。本论文以当前主流的社交平台为例,结合表示学习技术,针对未来链接以及未知链接预测进行了研究。本论文主要研究工作如下:1.在未来链接的预测方面,从社交网络中特征的异构性的角度出发,构建了一种基于特征表示与融合的链接预测模型。首先,针对结构空间的稀疏性和高维性,利用表示学习将其低秩稠密矢量化,以识别用户之间的空间关系,发现用户间的关联性;其次,考虑到文本语义的多样性和复杂性,引入词嵌入模型对用户文本向量化,并引入时间衰减函数,量化用户文本对链接形成的影响。同时,选取每个用户的top-k个关联用户,简化计算复杂度;最后,提出一种基于Attention和特征融合的链...
【文章来源】:重庆邮电大学重庆市
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
社交网络的三个特性
重庆邮电大学硕士学位论文第1章绪论6图1.3论文总体研究思路针对研究点一,论文以社交网络中的未来链接为切入点。基于网络中特征形态的异构性,利用表示学习将用户的关系数据以及历史文本数据表示为统一的低维向量,构建基于特征表示与融合的链接预测模型,预测用户未来可能建立的链接。首先,针对结构空间的稀疏性和高维性,利用表示学习将其低秩稠密矢量化,以识别用户之间的空间关系,发现用户间的关联性;其次,考虑到文本语义的多样性和复杂性,引入词嵌入模型提取用户文本的向量表达。并在其矩阵中引入时间衰减函数,量化用户文本对链接形成的影响。同时,对每个用户选取其top-k个关联用户,简化其计算复杂度;最后,提出一种基于Attention和特征融合的链接预测方法,对结构空间特征和用户文本特征进行融合与挖掘,最终实现从多个特征空间综合预测链接的目的。实验表明,该模型能有效提高链接预测性能。针对研究点二,论文以社交网络中的未知链接为切入点。考虑到社交网络中影响链接建立的因素非常多,因此充分考虑不同因素之间的关联性,构建基于混合概率的表示学习链接预测模型,挖掘用户的潜在关联,发现影响好友间产生链接关系的关键因素。首先基于用户关系和用户行为,分别构建共同好友比例矩阵、共同行为比率矩阵和兴趣相似度矩阵;其次,利用DeepWalk算法在网络表示中的优势,将三个矩阵融合并将其作为DeepWalk算法中随机游走的转移概率,得到用户的向量表达;最后,计算向量之间的相似度并进行阈值判断,预测用户之间的未知链接。实验表明,该模型能有效预测用户间的链接,并能发现影响好友间产生链接关系的关键因素。综上所述,本文的主要贡献和创新点体现在:1.本文设计了一种基于特征表示与融合的链接预测模型。基于表示学?
诮泳卣蟮氖?据也会变得非常稀疏。这些缺点导致关于社交网络的分析研究非常困难,因此研究者转而提出了新的网络表示方法。表示学习方法是一种分布式的表示方法。所谓的分布式,意思是描述某个节点或单词时,使用它的上下文来表示它,如“导师”,提到导师,就能联想到它的上下文可能是“学生、指导、论文”等词。与分布式表示不同,离散表示则将词与词孤立的表示,忽略了对象间的语义信息和上下文信息,如ont-hot表示和TF-IDF等。因此,分布式表示学习可以在向量中表明对象间的关联,更充分地利用了对象间的语义关系。图2.3表示学习示意图2.2.1无监督的表示学习方法目前,表示学习方法主要有以下两类[28]:无监督的表示学习方法(UnsupervisedNetworkEmbeddings)和属性表示学习方法(AttributedNetworkEmbeddings)。前者仅学习了网络结构信息,后者则包含了一些属性信息,如用户发布的文本信息。无监督的表示学习方法大致分为:基于矩阵特征向量的方法、基于神经网络的方法、基于矩阵分解的方法和保存特殊性质的方法[29]。基于矩阵特征向量的方法是较早的用于表示学习的算法,这类方法主要是通过构建关系矩阵得到网络中的节点表示,但是由于特征向量的计算较为复杂且需要大量存储空间,所以这类方法不适用于大规模网络。较为典型的几种方法有Laplace特征表(Laplaceeigenmap)[35]、局部线性表示(locallylinearembedding)[36]和有向图表示(directedgraphembedding)[37]等。基于神经网络的方法又分为简单神经网络和深层神经网络两种,DeepWalk[38]、
【参考文献】:
期刊论文
[1]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
[2]基于贝叶斯网的知识图谱链接预测[J]. 韩路,尹子都,王钰杰,胡矿,岳昆. 计算机科学与探索. 2017(05)
[3]Link prediction in social networks: the state-of-the-art[J]. WANG Peng,XU BaoWen,WU YuRong,ZHOU XiaoYu. Science China(Information Sciences). 2015(01)
硕士论文
[1]基于网络表示学习的推荐算法研究与实现[D]. 徐悦.北京邮电大学 2019
[2]基于文本向量表示学习的引文推荐方法研究[D]. 李飞.西北农林科技大学 2018
[3]基于概率模型的社会网络链接预测研究[D]. 徐宏.华南理工大学 2016
本文编号:3465656
【文章来源】:重庆邮电大学重庆市
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
社交网络的三个特性
重庆邮电大学硕士学位论文第1章绪论6图1.3论文总体研究思路针对研究点一,论文以社交网络中的未来链接为切入点。基于网络中特征形态的异构性,利用表示学习将用户的关系数据以及历史文本数据表示为统一的低维向量,构建基于特征表示与融合的链接预测模型,预测用户未来可能建立的链接。首先,针对结构空间的稀疏性和高维性,利用表示学习将其低秩稠密矢量化,以识别用户之间的空间关系,发现用户间的关联性;其次,考虑到文本语义的多样性和复杂性,引入词嵌入模型提取用户文本的向量表达。并在其矩阵中引入时间衰减函数,量化用户文本对链接形成的影响。同时,对每个用户选取其top-k个关联用户,简化其计算复杂度;最后,提出一种基于Attention和特征融合的链接预测方法,对结构空间特征和用户文本特征进行融合与挖掘,最终实现从多个特征空间综合预测链接的目的。实验表明,该模型能有效提高链接预测性能。针对研究点二,论文以社交网络中的未知链接为切入点。考虑到社交网络中影响链接建立的因素非常多,因此充分考虑不同因素之间的关联性,构建基于混合概率的表示学习链接预测模型,挖掘用户的潜在关联,发现影响好友间产生链接关系的关键因素。首先基于用户关系和用户行为,分别构建共同好友比例矩阵、共同行为比率矩阵和兴趣相似度矩阵;其次,利用DeepWalk算法在网络表示中的优势,将三个矩阵融合并将其作为DeepWalk算法中随机游走的转移概率,得到用户的向量表达;最后,计算向量之间的相似度并进行阈值判断,预测用户之间的未知链接。实验表明,该模型能有效预测用户间的链接,并能发现影响好友间产生链接关系的关键因素。综上所述,本文的主要贡献和创新点体现在:1.本文设计了一种基于特征表示与融合的链接预测模型。基于表示学?
诮泳卣蟮氖?据也会变得非常稀疏。这些缺点导致关于社交网络的分析研究非常困难,因此研究者转而提出了新的网络表示方法。表示学习方法是一种分布式的表示方法。所谓的分布式,意思是描述某个节点或单词时,使用它的上下文来表示它,如“导师”,提到导师,就能联想到它的上下文可能是“学生、指导、论文”等词。与分布式表示不同,离散表示则将词与词孤立的表示,忽略了对象间的语义信息和上下文信息,如ont-hot表示和TF-IDF等。因此,分布式表示学习可以在向量中表明对象间的关联,更充分地利用了对象间的语义关系。图2.3表示学习示意图2.2.1无监督的表示学习方法目前,表示学习方法主要有以下两类[28]:无监督的表示学习方法(UnsupervisedNetworkEmbeddings)和属性表示学习方法(AttributedNetworkEmbeddings)。前者仅学习了网络结构信息,后者则包含了一些属性信息,如用户发布的文本信息。无监督的表示学习方法大致分为:基于矩阵特征向量的方法、基于神经网络的方法、基于矩阵分解的方法和保存特殊性质的方法[29]。基于矩阵特征向量的方法是较早的用于表示学习的算法,这类方法主要是通过构建关系矩阵得到网络中的节点表示,但是由于特征向量的计算较为复杂且需要大量存储空间,所以这类方法不适用于大规模网络。较为典型的几种方法有Laplace特征表(Laplaceeigenmap)[35]、局部线性表示(locallylinearembedding)[36]和有向图表示(directedgraphembedding)[37]等。基于神经网络的方法又分为简单神经网络和深层神经网络两种,DeepWalk[38]、
【参考文献】:
期刊论文
[1]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
[2]基于贝叶斯网的知识图谱链接预测[J]. 韩路,尹子都,王钰杰,胡矿,岳昆. 计算机科学与探索. 2017(05)
[3]Link prediction in social networks: the state-of-the-art[J]. WANG Peng,XU BaoWen,WU YuRong,ZHOU XiaoYu. Science China(Information Sciences). 2015(01)
硕士论文
[1]基于网络表示学习的推荐算法研究与实现[D]. 徐悦.北京邮电大学 2019
[2]基于文本向量表示学习的引文推荐方法研究[D]. 李飞.西北农林科技大学 2018
[3]基于概率模型的社会网络链接预测研究[D]. 徐宏.华南理工大学 2016
本文编号:3465656
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3465656.html
最近更新
教材专著