Web网络社区发现中若干关键问题研究
发布时间:2018-05-08 11:03
本文选题:社区发现 + 边界 ; 参考:《解放军信息工程大学》2015年博士论文
【摘要】:随着Internet和通信技术的迅猛发展,Web网络开始逐步渗透到人类生活和生产的各个方面,在人们的信息交流、工作生活等方面都发挥着极为重要的作用。数以亿计的用户在各种Web网络平台上不断地进行信息交互,使得网络数据日益庞大和复杂化,从而给Web网络社区发现研究提出了新的问题和挑战:(1)面对大规模的网络数据,如何利用有限的局部信息实现快速准确的局部社区发现?(2)在Web网络节点多模化,网络关系多维化的背景下,如何基于异质网络发展出准确有效的社区发现方法?面对Web网络的局部性与异质性,传统的社区发现方法往往难以适用,无法有效地揭示局部或异质网络环境下的社区结构特征。围绕着Web网络社区发现的这两个关键问题,论文基于现有问题研究适用于局部网络和异质网络的社区发现方法。主要的研究工作如下:1.针对局部社区边界节点难以确定的问题,提出了一种基于边界识别的局部社区发现算法。该方法一方面通过全面分析局部社区邻接子图范围内连接相似性,从而获取给定节点所在社区的局部结构特征并进行节点聚类;同时在社区聚类过程中,基于邻接节点内外的连接状况反复识别其边界节点,从而控制社区聚类的规模和范围以完成局部社区发现。该算法采用了有别于最大化局部社区结构指标的思路和方法,以节点相似性模块度作为局部社区发现的衡量标准,通过边界节点识别解决已有方法存在的“何时停止聚类迭代”和给定节点位置敏感等问题。2.针对给定节点位置不确定性对局部社区发现的影响,提出了一种基于核心节点跳转的局部社区发现算法,该方法避免从给定节点直接扩张,而是搜索给定节点附近的核心节点,由邻近核心节点扩展为核心节点子团;并建立基于节点子团的适应度函数,据此进行节点子团合并以实现局部社区发现。与传统的基于给定节点的局部社区相比,该方法能从任意给定节点跳转到核心节点,从而能够有效避免给定节点自身的位置和影响力对社区发现的限制和影响;同时,该方法能够较为精确地控制局部社区的聚类过程和节点归属,并确定社区范围内的核心节点分布。3.为将二分网络、多模网络和多维网络统一在同一框架下,提出了异质网络模型。受二部图模型启发,该模型将异质网络描述为多个关联的二部图结构。该异质网络模型既能准确地描述异质网络数据本身,也能反映异质节点之间的复杂关系。更重要的是,该模型使得最简单的异质网络——二分网络与多模/多维网络在模型概念上得到了有效地统一和兼容,为后续的异质网络结构挖掘提供了的理论基础,使得引入更多方法来解决异质网络社区发现的问题成为可能。4.为避免二分网络二分结构对社区发现的限制,提出了一种基于图正则化的三重非负矩阵分解(F-NMTF)算法。通过分别构建两类异质节点的近邻图来估计用户子空间和目标子空间的结构特征,将其作为正则化约束项引入到NMTF模型中,从而同时引入了类间信息和类内信息,以增强非负矩阵分解的正交性和收敛性,并摆脱二分结构的限制;同时将NMTF分解为两个关于交替求解最小化函数的子问题,并给出了一种乘性更新因子矩阵的交替迭代算法,从而使矩阵分解迭代得以简化,加快收敛速度。实验和分析证明:对于计算机生成网络和真实网络,F-NMTF的社区划分方案均表现出有较高的准确率和稳定性,能够准确有效地挖掘二分网络的社区结构。5.为充分有效地挖掘异质网络中复杂的多模或多维关系,提出了一种基于多视图学习的联合矩阵非负分解算法(Joint-NMF)。基于异质网络模型,该方法将异质网络数据转化为多个相关联的二部图;借鉴多视图(Multi-view)的分析方法,将基于单个图的半监督学习扩展到多个视图的情况,使不同的二部图之间能够提供互信息,以实现异质网络图间的协同学习。Joint-NMF算法在整个聚类学习过程综合考虑了异质网络图的网络结构,从而使得所有二部图学习器对中心模式节点的划分趋于一致。实验结果表明:在异质网络条件下,综合多个二部图结构的半监督算法Joint-NMF比无监督算法有更优的社区发现性能。
[Abstract]:With the rapid development of Internet and communication technology , the Web network starts to penetrate into every aspect of human life and production , and plays a very important role in people ' s information exchange and working life .
At the same time , in the process of community clustering , the boundary nodes are repeatedly identified based on the connection conditions inside and outside the adjacent nodes , so as to control the size and scope of the community cluster so as to complete the local community discovery .
Compared with the traditional local community based on a given node , the method can jump from any given node to the core node , so that the limitation and influence of the position and influence of a given node itself on the community discovery can be effectively avoided ;
In order to avoid the restriction on community discovery , the model enables the simplest heterogeneous network _ dichotomy network and multi - mode / multi - dimensional network to be effectively unified and compatible . In order to avoid the restriction on community discovery in the second sub - network , this model can be used as a regular constraint term in the NMTF model , so as to enhance the orthogonality and convergence of non - negative matrix factorization , and get rid of the limitation of dichotomy structure .
At the same time , the NMTF is decomposed into two sub - problems for solving the minimization function of alternating solution , and an alternate iterative algorithm of multiplicative update factor matrix is presented , which can simplify the matrix decomposition iteration and speed up the convergence speed .
Based on the multi - view analysis method , the semi - supervised learning based on a single graph is extended to multiple views , so that mutual information can be provided between different two graphs to realize the cooperative learning between heterogeneous network graphs . The joint - NMF algorithm takes into account the network structure of the heterogeneous network graph in the whole cluster learning process , so that all two - part graph learning devices are more consistent with the division of the central mode nodes .
【学位授予单位】:解放军信息工程大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP393.09
【参考文献】
相关期刊论文 前10条
1 杨欣欣;黄少滨;;基于图划分的网状高阶异构数据联合聚类算法[J];四川大学学报(工程科学版);2014年02期
2 潘磊;金杰;王崇骏;谢俊元;;社会网络中基于局部信息的边社区挖掘[J];电子学报;2012年11期
3 吴英骏;黄翰;郝志峰;陈丰;;Local Community Detection Using Link Similarity[J];Journal of Computer Science & Technology;2012年06期
4 金弟;杨博;刘杰;刘大有;何东晓;;复杂网络簇结构探测——基于随机游走的蚁群算法[J];软件学报;2012年03期
5 林友芳;王天宇;唐锐;周元炜;黄厚宽;;一种有效的社会网络社区发现模型和算法[J];计算机研究与发展;2012年02期
6 吴斌;王柏;杨胜琦;;基于事件的社会网络演化分析框架[J];软件学报;2011年07期
7 金弟;刘杰;杨博;何东晓;刘大有;;局部搜索与遗传算法结合的大规模复杂网络社区探测[J];自动化学报;2011年07期
8 龚卫华;杨良怀;金蓉;丁维龙;;基于主题的用户兴趣域算法[J];通信学报;2011年01期
9 何东晓;周栩;王佐;周春光;王U,
本文编号:1861131
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1861131.html