当前位置:主页 > 科技论文 > 软件论文 >

基于网络结构和节点语义信息的社区发现研究

发布时间:2024-02-25 15:50
  随着网络数据规模的日益增大,各种类型的网络变得越来越复杂,传统网络中的社区发现方法面临着巨大的挑战,往往难以解决高维网络空间的社区划分问题。为了能够更准确的发现大规模网络中的社区结构,本文将机器学习中相关算法融合到社区发现中,提出了一种基于网络结构和节点内容属性的重叠社区发现方法。在基于网络结构的社区发现方法过程中,本文首先选取DeepWalk网络表示学习方法将网络图中节点表示成低维向量,每个节点的低维向量表示从某种程度上反应了该节点在网络中的连接情况。此时,我们便可以将每个节点看作是一个样本,向量的每个维度都可以看做一个特征,将样本数据输入到变分高斯混合聚类模型中训练。从而得到网络中每个节点的聚类结果,此处的类相当于网络中的社区。此外,该过程中得到的聚类个数可进一步作为基于内容建模的输入。在基于节点内容属性进行社区发现过程中,本文使用主题模型对节点内容进行多维属性建模,从而得到节点的多重社区归属分布问题。算法进一步考虑到网络中节点内容短小在主题建模过程中导致的数据稀疏问题,在LDA主题模型中引入Spike and Slab prior方法辅助实现变量选择和参数估计,有效地解决节点上社...

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

;图4.1LDA模型;

;图4.1LDA模型;

图4.1LDA模型过程,从图中我们可以看到w是档-主题分布,为主题-词分hyperparameter)为的先验分中每个词的过程如下:程表示对于语料库中每一篇文档式分布,该分布的先验分布是超),生成文档m中词n的主题,这一过程表示对于文档m....


图4.1LDA模型

图4.1LDA模型

图4.1LDA模型过程,从图中我们可以看到w是档-主题分布,为主题-词分hyperparameter)为的先验分中每个词的过程如下:程表示对于语料库中每一篇文档式分布,该分布的先验分布是超),生成文档m中词n的主题,这一过程表示对于文档m....


图5.1样本聚类图

图5.1样本聚类图

了小数据集进行向量表示,给出社区划分示例。该数据集中共有272个节点,可社区。在实验中我们将其表示成二维向量,然后分别采用高斯混合聚类模型以及合模型对样本集合聚类。在这两个模型中,我们均设置初始类的个数k为5,下两种模型中样本数据相对应的聚类标签。表5.1样本数据聚....


图5.2游走次数和滑动窗口大小参数选择下F1值曲线

图5.2游走次数和滑动窗口大小参数选择下F1值曲线

1模型参数的影响本章节实验分为两个阶段,第一个阶段将网络中节点表示成向量,该阶段主要Walk网络表示学习算法,涉及到的参数选择共有四个,分别为每个节点生成随机游长度t、每个节点随机游走次数、节点表示维度的大小d以及滑动窗口大小w。第根据节点的向量表示进行聚类,然后分....



本文编号:3910541

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3910541.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b8d79***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com