基于深度神经网络的图嵌入模型研究
发布时间:2021-06-25 08:39
现实世界中,许多重要的数据都以复杂网络或图的形式存在,比如引文网络,交通网络,基因网络等。网络中节点本身附带的特征信息及节点之间的链接关系包含大量的价值信息。另外,动态网络中的时空依赖信息,对分析动态网络的变化趋势及预测网络中节点的行为也有着重要意义。然而当前的图嵌入方法并不能很好的实现网络图嵌入,比如:基于矩阵分解的方法能够捕获网络中的结构信息,但其受限于庞大的运算量从而无法处理大规模网络。基于随机游走的方法,也能学习到网络的结构信息,但不能捕获网络的全局结构信息也不能将节点属性、标签等信息利用起来。对于动态网络,当前的图嵌入模型主要是通过施加一个时间正则化来增强相邻动态网络镜像中节点表示的平滑性,并且假设动态网络的时空演化持续很短(如假设只持续两步变化)。当节点表现出明显不同的演化行为时,这些方法可能会失效。另外,当前的图嵌入模型多基于浅层模型难以捕获复杂网络的深层特征。随着深度学习技术的飞速发展,其在多个领域取得了长足的进步。本文将着重研究基于深度学习的图嵌入模型,并根据静态网络和动态网络的特性,提出分别能处理静态网络和动态网络的图嵌入模型。具体研究内容如下:(1)针对静态网络,...
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
复杂网络实例
江南大学硕士学位论文30图3-2在Cora和Citeseer数据集上节点分类结果图3-3在USPowerGrid和Wikipedia数据集上节点分类结果
第三章基于图GCN和AE的半监督图嵌入模型31观察实验结果图3-2、3-3发现,本章的模型在节点分类任务上,性能明显优于其他几个对比模型,在USPowerGrid数据集上更是遥遥领先。对于Wikipedia这样拥有众多标签的数据集,虽然在只训练10%到20%样本时1指标低于SDNE模型。当训练样本数达到80%以上时,本章的模型能够保持较好的稳定性,性能要优于其他对比模型。总体而言在Wikipebia数据集上,本章的模型节点分类性能优于其他对比的模型。由此可以说明本章所提出的Semi-GCNAE模型学习到网络节点低维向量表示,相对其他几个模型在节点多标签分类上有更好的表现。3.5.2可视化对学习到的节点低维向量表示进行可视化,能直观的评估图嵌入模型习得的节点低维向量表示的水平。本章将嵌入空间的维度亦即习得的低维向量的维度设置为128维,并采用t分布随机嵌入[73,74](t-distributedstochasticneighborembedding,简称t-SNE)的方法将128维的向量表示降至为2维向量表示,这些2维向量表示能够保留网络的固有结构,即相似的节点彼此靠近,不同的节点彼此分离。反应在图中便是不同的群落分布在不同的位置,其中每个点都对应于网络中的一个节点,对于每个点所属的类别本章使用不同的颜色进行标注。将习得的向量表示降维并在图中绘制出来,以便直观地观察复杂信息网络或图中节点的群落结构。在Cora和Citeseer数据集上可视化结果显示本章的模型能够很好的反应网络的群落结构,实验结果如图3-4、3-5所示:图3-4Semi-GCNAE,GCN,GAT,SDNE,HOPE,GF模型在Cora数据集上的可视化结果
【参考文献】:
期刊论文
[1]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
[2]Hawkes过程分支比估计——一种简单的非参数方法[J]. 吴奔,张波. 统计研究. 2015(03)
本文编号:3248889
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
复杂网络实例
江南大学硕士学位论文30图3-2在Cora和Citeseer数据集上节点分类结果图3-3在USPowerGrid和Wikipedia数据集上节点分类结果
第三章基于图GCN和AE的半监督图嵌入模型31观察实验结果图3-2、3-3发现,本章的模型在节点分类任务上,性能明显优于其他几个对比模型,在USPowerGrid数据集上更是遥遥领先。对于Wikipedia这样拥有众多标签的数据集,虽然在只训练10%到20%样本时1指标低于SDNE模型。当训练样本数达到80%以上时,本章的模型能够保持较好的稳定性,性能要优于其他对比模型。总体而言在Wikipebia数据集上,本章的模型节点分类性能优于其他对比的模型。由此可以说明本章所提出的Semi-GCNAE模型学习到网络节点低维向量表示,相对其他几个模型在节点多标签分类上有更好的表现。3.5.2可视化对学习到的节点低维向量表示进行可视化,能直观的评估图嵌入模型习得的节点低维向量表示的水平。本章将嵌入空间的维度亦即习得的低维向量的维度设置为128维,并采用t分布随机嵌入[73,74](t-distributedstochasticneighborembedding,简称t-SNE)的方法将128维的向量表示降至为2维向量表示,这些2维向量表示能够保留网络的固有结构,即相似的节点彼此靠近,不同的节点彼此分离。反应在图中便是不同的群落分布在不同的位置,其中每个点都对应于网络中的一个节点,对于每个点所属的类别本章使用不同的颜色进行标注。将习得的向量表示降维并在图中绘制出来,以便直观地观察复杂信息网络或图中节点的群落结构。在Cora和Citeseer数据集上可视化结果显示本章的模型能够很好的反应网络的群落结构,实验结果如图3-4、3-5所示:图3-4Semi-GCNAE,GCN,GAT,SDNE,HOPE,GF模型在Cora数据集上的可视化结果
【参考文献】:
期刊论文
[1]网络表示学习综述[J]. 涂存超,杨成,刘知远,孙茂松. 中国科学:信息科学. 2017(08)
[2]Hawkes过程分支比估计——一种简单的非参数方法[J]. 吴奔,张波. 统计研究. 2015(03)
本文编号:3248889
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3248889.html