属性网络社团挖掘算法研究
发布时间:2025-02-06 15:16
随着科学技术的发展,人们能够收集到的网络数据类型也日渐丰富。除了网络节点之间的拓扑结构信息,其本身的属性信息也越来越多地被获取到,这种网络被称为属性网络。传统的社团挖掘算法往往只利用了网络的拓扑结构,而没有考虑节点的属性信息。因此,如何将节点的拓扑和属性信息进行有机地融合,以帮助对社团结构进行挖掘,是近年来的一个重要研究问题。在网络数据中,节点属性与拓扑的一致性假设指的是具有相似属性的节点之间更倾向形成拓扑连边,它是一座将节点属性以及拓扑结构这两类数据进行融合的桥梁。基于该假设,有效地使用这两类数据往往能够对社团挖掘任务达到互补的效果。然而,由于节点属性中存在大量的噪声,直接利用它们度量节点之间属性的相似性,往往会导致相似性不准确。特征选择作为一个常用的数据挖掘手段,可以很好地避免无关属性造成的影响。然而,在网络拓扑结构中,节点之间的连边大部分集中于相同社团内,这种拓扑结构上的局部性导致了一致性假设应该也具有局部性,即在不同的社团内,节点之间连边的形成受到不同属性的影响,这种特征往往无法通过特征选择反映。因此,本文基于网络拓扑结构与节点属性一致性假设的局部性,提出在进行社团挖掘的时候,仅...
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
本文编号:4030550
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
图1-1SantaFe机构人员协作网络[6]
电子科技大学硕士学位论文1.2国内外研究现状由于本文的工作内容主要与社团挖掘与子空间聚类这两个方向有关,本节对它们的国内外研究现状做出详述。这些工作将会启发本文的研究动机,并在思路上给予我们借鉴的价值。1.2.1社团挖掘社团挖掘任务的主要目标是在网络中找到这样的子图,其中的节点较....
图1-2子空间示意图[20]
稀疏的空间内,常用的距离度量方法计算出数据样本之间的距离趋向于相同。受到该不可避免因素的影响,基于此的聚类算法一般会失去作用。子空间的一个重要理论基础是,形成簇的数据样本,它们并不是在所有特征上都相似,仅仅在特征的一个子集或者新的投影空间上可以被观测到具有很大的相似性,并且对于不....
图2-1两种拓扑相似性图示
第二章相关概念与技术(a)(b)图2-1两种拓扑相似性图示。(a)结构;(b)规则这部分将只会对几种经典的节点结构相似性度量方法做出一些介绍,这些方法整体上都是基于共同邻居以及一些正则化手段进行计算。余弦相似性:该度量方法计算邻接矩阵的第行和第列向量的余弦值作为网络节点和节点之间....
图2-2样本统计直方图[32]
电子科技大学硕士学位论文-近邻图为4个,而全连接图是1个。这与2.2.2章节中非标准拉普拉斯矩阵的性质一致,即近邻图通过设置领域的方式,将数据样本划分成了4个全连接子图,而由高斯相似性度量形成的全连接图内,所有节点之间均是连通的。第二个是这两个拉普拉斯矩阵最小的四个特征值对应的特....
本文编号:4030550
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4030550.html