基于多粒度结构的网络表示学习方法研究
发布时间:2020-12-21 11:18
随着大数据时代的来临,社交网络等迅速发展并产生海量且关系复杂的网络数据且隐含很多重要且有价值的信息。面对海量数据,传统的邻接矩阵等向量表示形式存在向量稀疏、计算复杂度高的问题,而网络表示学习将海量数据转化为低维稠密的向量表示并将其作为常用的机器学习算法的输入进行网络分析任务,使得快速高效的进行网络分析成为可能,因此具有重要的研究意义。网络表示学习的核心思想是在保留网络的拓扑结构特征的基础上找到一个映射函数,将网络中的节点转化为低维稠密的表示学习向量,进而用于后续的网络分析任务。已有的基于单粒度结构的网络表示方法主要包括基于矩阵分解的表示学习方法,基于随机游走的表示学习方法,基于深度神经网络的表示学习方法等。然而,复杂网络的一系列的研究证实,现实世界中的许多网络呈现出一种多粒度结构,且利用随机游走方式挖掘网络的结构特征存在仅捕获低阶结构而忽略网络的高阶结构特征的缺点,因此本研究在保留网络局部结构的基础上,引入多粒度结构特征提升网络的网络分析任务的准确率。综上所述,本文的主要研究工作包括:1.本文首先对网络表示学习的背景知识做出简洁的介绍,充分调研国内外有关网络表示学习问题的研究现状以及基...
【文章来源】: 孙仙 安徽大学
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
网络表示学习过程
郑?渲形藜喽讲糠掷?米远?嗦肫?来重建节点的邻域,有监督部分当嵌入空间的节点之间的距离相距较远时利用Laplacian特征映射[31]进行映射,其框架如图1.2[32]所示。DNGR结合随机冲浪和深度自动编码器构建模型,在输入图上使用随机冲浪模型生成概率共生矩阵,并输入到叠加去噪的自编码器中获得网络表示向量。图卷积网络(GCNs)[37]通过迭代地合并节点邻域嵌入,并利用映射函数和前一轮的映射函数来获得新一轮的网络嵌入。除此之外,有研究学者提出利用图卷积和网络节点的标签信息来获得非监督嵌入[38-43]的方法。图1.2SDNE算法的框架Fig.1.2TheframeworkofSDNE随着嵌入技术在自然语言处理领域取得重要突破,word2vec中的Skip-gram模型很大程度上影响网络嵌入的最新进展,它的输入是由自然语言中的句子组成的文本语料库,输出是语料库中每个单词的潜在向量表示[44]。受此设置启发,基于随机游走的网络表示学习方法受到越来越多学者的关注。DeepWalk[6]通过考虑通过随机游动在网络上遍历的节点路径作为句子和学习节点表示,通过最大化预测其在步行序列中的上下文节点的可能性。随机游动已被用来逼近图中的许多性质,包括节点中心性[45]和相似度[46]。随着DeepWalk的出现,越来越多的专家学者也将目光聚焦在基于随机游走的表示学习方法研究。LINE[17]保留网络中节点的一阶相似性和二阶近邻性来分别优化以获得网络表示向量。与DeepWalk不同,Node2Vec[18]将DFS和BFS探索结合在随机漫游框架中。
安徽大学硕士学位论文7图1.3论文的主要研究内容Fig.1.3Themainresearchcontentsofthedissertation1.3.2组织结构针对上述研究内容,本文五大章节的具体结构安排如下:第一章:绪论。本章介绍网络表示学习问题的主要研究背景及应用意义;然后从本文的研究角度出发,阐述网络表示学习问题不同解决方法下的国内外研究现状;最后对本文的研究内容和组织结构进行整体的介绍。第二章:相关理论知识。本章首先对网络表示学习问题进行定义;然后详细介绍本文所提算法的基础模型,这是和本文密切相关的前人工作基础;接着介绍网络表示学习问题在本文中所使用的评价标准;最后给出本章的总结。第三章:基于多粒度多粒度社团结构的网络表示学习方法。首先对所研究的问题进行分析与定义,根据研究所面临的挑战,给出相应的解决方案。首先基于复杂网络具有层次性社团结构的特点,构造多粒度网络,获取网络的多粒度社团结构特征信息。然后将粗粒度层的结构特征向量作为上一层较细粒度的结构特征向量的初始值来进行特征传递以保留网络的局部结构和层间结构特征。最后,基于该网络表示向量,在多组公共数据集上进行网络分析任务,以验证所提出的算法的有效性与适用性。第四章:基于多粒度高阶结构的网络表示学习方法。首先对所研究的问题进行分析
【参考文献】:
期刊论文
[1]大规模复杂信息网络表示学习:概念、方法与挑战[J]. 齐金山,梁循,李志宇,陈燕方,许媛. 计算机学报. 2018(10)
[2]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
本文编号:2929739
【文章来源】: 孙仙 安徽大学
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
网络表示学习过程
郑?渲形藜喽讲糠掷?米远?嗦肫?来重建节点的邻域,有监督部分当嵌入空间的节点之间的距离相距较远时利用Laplacian特征映射[31]进行映射,其框架如图1.2[32]所示。DNGR结合随机冲浪和深度自动编码器构建模型,在输入图上使用随机冲浪模型生成概率共生矩阵,并输入到叠加去噪的自编码器中获得网络表示向量。图卷积网络(GCNs)[37]通过迭代地合并节点邻域嵌入,并利用映射函数和前一轮的映射函数来获得新一轮的网络嵌入。除此之外,有研究学者提出利用图卷积和网络节点的标签信息来获得非监督嵌入[38-43]的方法。图1.2SDNE算法的框架Fig.1.2TheframeworkofSDNE随着嵌入技术在自然语言处理领域取得重要突破,word2vec中的Skip-gram模型很大程度上影响网络嵌入的最新进展,它的输入是由自然语言中的句子组成的文本语料库,输出是语料库中每个单词的潜在向量表示[44]。受此设置启发,基于随机游走的网络表示学习方法受到越来越多学者的关注。DeepWalk[6]通过考虑通过随机游动在网络上遍历的节点路径作为句子和学习节点表示,通过最大化预测其在步行序列中的上下文节点的可能性。随机游动已被用来逼近图中的许多性质,包括节点中心性[45]和相似度[46]。随着DeepWalk的出现,越来越多的专家学者也将目光聚焦在基于随机游走的表示学习方法研究。LINE[17]保留网络中节点的一阶相似性和二阶近邻性来分别优化以获得网络表示向量。与DeepWalk不同,Node2Vec[18]将DFS和BFS探索结合在随机漫游框架中。
安徽大学硕士学位论文7图1.3论文的主要研究内容Fig.1.3Themainresearchcontentsofthedissertation1.3.2组织结构针对上述研究内容,本文五大章节的具体结构安排如下:第一章:绪论。本章介绍网络表示学习问题的主要研究背景及应用意义;然后从本文的研究角度出发,阐述网络表示学习问题不同解决方法下的国内外研究现状;最后对本文的研究内容和组织结构进行整体的介绍。第二章:相关理论知识。本章首先对网络表示学习问题进行定义;然后详细介绍本文所提算法的基础模型,这是和本文密切相关的前人工作基础;接着介绍网络表示学习问题在本文中所使用的评价标准;最后给出本章的总结。第三章:基于多粒度多粒度社团结构的网络表示学习方法。首先对所研究的问题进行分析与定义,根据研究所面临的挑战,给出相应的解决方案。首先基于复杂网络具有层次性社团结构的特点,构造多粒度网络,获取网络的多粒度社团结构特征信息。然后将粗粒度层的结构特征向量作为上一层较细粒度的结构特征向量的初始值来进行特征传递以保留网络的局部结构和层间结构特征。最后,基于该网络表示向量,在多组公共数据集上进行网络分析任务,以验证所提出的算法的有效性与适用性。第四章:基于多粒度高阶结构的网络表示学习方法。首先对所研究的问题进行分析
【参考文献】:
期刊论文
[1]大规模复杂信息网络表示学习:概念、方法与挑战[J]. 齐金山,梁循,李志宇,陈燕方,许媛. 计算机学报. 2018(10)
[2]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
本文编号:2929739
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2929739.html