链接数据社团演化分析系统的设计与实现
发布时间:2020-12-25 03:51
在网络中紧密连接的节点构成社团,社团能够反映网络的结构特性,对实现网络结构优化、理解网络的功能以及发现网络中隐藏规律等有很大的帮助。然而,目前对于链接数据的社团挖掘以及相关研究的工作较少。链接数据多模式多维度的复杂结构对链接数据中的社团发现工作带来障碍。在复杂网络分析领域,在动态网络中开展社团分析是一个研究热点。通常,链接数据中包含丰富的时间信息,这为动态地研究链接数据提供基础。本文借鉴复杂网络中动态网络研究方法并结合链接数据的特点,实现了链接数据社团演化分析系统。首先,通过对链接数据中结构化以及无结构化时间信息的抽取,从时间维度上对链接数据进行建模。其次,将协作网络思想推广至链接数据,提出链接数据ARC模型,并基于此模型提出不同时间窗口协作网络的构建方法。除此之外,本文给出了一种基于链接数据张量分解的实体距离度量方法,并结合基于中心度的社团发现算法,高效地完成社团发现工作。对于链接数据社团演化行为的分析,提出了一种更合理的演化事件定义与检测方法。最后,基于社团发现以及社团演化事件的检测结果以可视化的方式展示给用户,帮助用户直观地了解链接数据挖掘结果,并作进一步的研究。通过本文系统可以...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
网络中的社团
如图2-1 所示。社团演化事件与动态网络的社团发现关系密切,为了研究这些演化事件,比较直接的想法就是基于每个快照社团发现结果上,比较不同时刻的社团从而检测出与社团相关的一系列事件。Asur 等人通过位操作的形式实现定义相邻快照检测出的社团之间的关键事件[46]。然而,这些事件并不涵盖特定的社区所有可能发生的变化。Takaffoli 等人[47]提供了一个基于事件的框架来捕获连续两次快照之间的所有变化社团。在他们以后的工作文献[48]中,事件定义公式被改进以追踪而不是整个观察时间的社区变化而不仅只在两个连续的快照之间。Kim 等人将了经典混合模型拓展至时间维度,提出了时间混合多项式模型 TMM[49],用以发现社团之间的生成、分裂,并追溯社团的源头。除了检测社团的演化事件,为了表征演化事件发生的速度,文献[50]中给出了相应的公式定义。更全面地,Spiliopoulou 在文献[51]给出了社团演化过程中对于各种演变过程的指标,如反映社团规模变化的 size transition
为人工指定的嵌入的维度,其过程如图3-5 所示。通过计算矩阵 和 来解决公式(3.2),(3.3),(3.4)中的最优化问题,其中公式(3.2)中的 ( )是正则项,防止出现过度拟合。 (3.1) ( ) ( ) (3.2) ( ) ◎ (3.3) ( ) ◎ (3.4)本文使用 RESCAL[67]作为张量分解工具来生成链接数据中实体的嵌入。对于 中两个实体 和 ,通过矩阵 获得其 维嵌入表示 和 。实体 和 之间的嵌入距离由公式(3.5)计算,其中 ( )是 和 的余弦相似性,若实体 和 距离越近
【参考文献】:
期刊论文
[1]标签传播算法理论及其应用研究综述[J]. 张俊丽,常艳丽,师文. 计算机应用研究. 2013(01)
[2]基于K-medoids聚类算法的研究与实现[J]. 王忠强,李贵,韩子扬,郑新录. 硅谷. 2011(02)
[3]关联数据及其应用现状综述[J]. 沈志宏,张晓林. 现代图书情报技术. 2010(11)
[4]复杂网络聚类方法[J]. 杨博,刘大有,金弟,马海宾. 软件学报. 2009(01)
本文编号:2936905
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
网络中的社团
如图2-1 所示。社团演化事件与动态网络的社团发现关系密切,为了研究这些演化事件,比较直接的想法就是基于每个快照社团发现结果上,比较不同时刻的社团从而检测出与社团相关的一系列事件。Asur 等人通过位操作的形式实现定义相邻快照检测出的社团之间的关键事件[46]。然而,这些事件并不涵盖特定的社区所有可能发生的变化。Takaffoli 等人[47]提供了一个基于事件的框架来捕获连续两次快照之间的所有变化社团。在他们以后的工作文献[48]中,事件定义公式被改进以追踪而不是整个观察时间的社区变化而不仅只在两个连续的快照之间。Kim 等人将了经典混合模型拓展至时间维度,提出了时间混合多项式模型 TMM[49],用以发现社团之间的生成、分裂,并追溯社团的源头。除了检测社团的演化事件,为了表征演化事件发生的速度,文献[50]中给出了相应的公式定义。更全面地,Spiliopoulou 在文献[51]给出了社团演化过程中对于各种演变过程的指标,如反映社团规模变化的 size transition
为人工指定的嵌入的维度,其过程如图3-5 所示。通过计算矩阵 和 来解决公式(3.2),(3.3),(3.4)中的最优化问题,其中公式(3.2)中的 ( )是正则项,防止出现过度拟合。 (3.1) ( ) ( ) (3.2) ( ) ◎ (3.3) ( ) ◎ (3.4)本文使用 RESCAL[67]作为张量分解工具来生成链接数据中实体的嵌入。对于 中两个实体 和 ,通过矩阵 获得其 维嵌入表示 和 。实体 和 之间的嵌入距离由公式(3.5)计算,其中 ( )是 和 的余弦相似性,若实体 和 距离越近
【参考文献】:
期刊论文
[1]标签传播算法理论及其应用研究综述[J]. 张俊丽,常艳丽,师文. 计算机应用研究. 2013(01)
[2]基于K-medoids聚类算法的研究与实现[J]. 王忠强,李贵,韩子扬,郑新录. 硅谷. 2011(02)
[3]关联数据及其应用现状综述[J]. 沈志宏,张晓林. 现代图书情报技术. 2010(11)
[4]复杂网络聚类方法[J]. 杨博,刘大有,金弟,马海宾. 软件学报. 2009(01)
本文编号:2936905
本文链接:https://www.wllwen.com/kejilunwen/yysx/2936905.html