k核心子图查询算法研究
本文选题:k核心子图 + 全局搜索 ; 参考:《燕山大学》2016年硕士论文
【摘要】:给定图G、查询结点v以及用户指定的k值,k核心子图查询用于从G中返回包含结点v且任意结点的度均大于或者等于k的一个子图。k核心子图主要应用于朋友推荐、社交网络中的广告宣传、疾病控制和语义扩张等方面。在此从以下几个方面对k核心子图查询问题进行了深入研究。首先,通过深入分析现有的k核心子图查询处理方法,发现现有算法在生成k核心子图时存在冗余遍历问题。其次,提出对图进行预处理的pre_CST算法。该算法对每个结点的邻居结点按度数进行排序,同时记录邻居中度数大于或者等于k的结点数目,以便为后续k核心子图求解提供便利。再次,提出高效的k核心子图求解算法CST。该算法充分利用预处理得到的信息,提出三种避免冗余遍历的策略,包括(1)当遍历当前结点的邻居结点时,如果发现某个邻居结点的度数小于k,那么对该结点之后的所有结点无需进行访问;(2)当邻居中度数大于或者等于k的结点数目小于k时,当前结点不会加入到候选子图中;(3)利用优先队列对要加入到k核心子图中的候选结点进行排序,优先加入与当前k核心里有最多关联边的候选结点,从而减少k核心子图查询时无效结点的加入。以上三种策略都能避免对无用结点的处理,从而减少冗余遍历,提高查询效率。最后,基于真实数据集,通过不同评价指标,对提出算法的高效性进行了验证。
[Abstract]:Advertising, disease control and semantic expansion in social networks. In this paper, the query problem of k-core subgraph is studied from the following aspects. Firstly, by analyzing the existing query processing methods of k-core subgraph, it is found that the existing algorithm has redundant traversal problem in generating k-core subgraph. Secondly, the pre_CST algorithm is proposed to preprocess the graph. In this algorithm, the neighbor nodes of each node are sorted by degrees, and the number of nodes whose degree is greater than or equal to k in the neighbor is recorded, so as to facilitate the solution of subsequent k-core subgraphs. Thirdly, an efficient k-core subgraph solution algorithm, CST, is proposed. Taking full advantage of the preprocessing information, the algorithm proposes three strategies to avoid redundant traversal, including 1) when traversing the neighbor nodes of the current node. If it is found that the degree of a neighbor node is less than k, then all nodes after that node do not need to be accessed) when the number of nodes in the neighbor whose degree is greater than or equal to k is less than k, The current node will not be added to the candidate subgraph.) priority queue is used to sort the candidate node to join the k-core subgraph, and the candidate node with the most associated edges in the current k-core is added first. In order to reduce the k-core subgraph query invalid nodes added. The above three strategies can avoid the processing of useless nodes, thus reducing redundant traversal and improving query efficiency. Finally, based on the real data set, the efficiency of the proposed algorithm is verified by different evaluation indexes.
【学位授予单位】:燕山大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O157.5;TP391.3
【相似文献】
相关期刊论文 前10条
1 孙亮;叶淼林;;图的子图匹配数与图的标准化拉普拉斯谱[J];安庆师范学院学报(自然科学版);2011年04期
2 陈赐平;;带亏数的[1,n]-子图[J];北京农业工程大学学报;1987年03期
3 李学良;;有向1-因子图[J];新疆大学学报(自然科学版);1988年02期
4 李传湘;层次结构中封闭子图的映射[J];数学物理学报;1990年04期
5 郭思平;;立方图中一类具有极大边数子图的性质[J];云南师范大学学报(自然科学版);1991年04期
6 谢力同,范红兵;关于局部子图可重构性的一个新结果(英文)[J];数学进展;1997年05期
7 龙和平,谢力同,颜谨,刘桂真;边型带权核子图的边可重构性[J];山东大学学报(理学版);2002年02期
8 李慰萱;;图的结构多项式与子图恒等式[J];长沙铁道学院学报;1979年03期
9 郭知熠;关于完全k-边可染子图[J];华中工学院学报;1985年06期
10 辛林,徐恭勤;子图个数的计算问题[J];教学与教材研究;1994年03期
相关会议论文 前4条
1 徐以凡;;层分解和子图识别问题[A];2001年全国数学规划及运筹研讨会论文集[C];2001年
2 陶剑文;丁佩芬;赵杰煜;;csgIndex:一种可扩展的对比子图索引模型[A];第二十七届中国控制会议论文集[C];2008年
3 吴卫江;李国和;;Apriori算法思想在频繁子图挖掘中应用的研究[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
4 吴颖华;周皓峰;袁晴晴;洪铭胜;汪卫;施伯乐;;Topology:一个快速的频繁连通子图的挖掘算法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
相关博士学位论文 前5条
1 李斌龙;重子图条件下图的Hamilton性及相关问题[D];西北工业大学;2016年
2 蔺厚元;禁用子图与图的哈密尔顿性[D];华中师范大学;2012年
3 毛玲;基于层次因子图的心电图自动诊断方法研究[D];国防科学技术大学;2009年
4 崔庆;Tutte子图方法及其应用[D];南开大学;2009年
5 吴云建;一致星因子图与笼的连通性[D];南开大学;2009年
相关硕士学位论文 前10条
1 范淦;高效的庞大图的频繁子图挖掘方法研究[D];辽宁大学;2015年
2 魏真真;大规模不确定图紧密子图挖掘算法研究[D];燕山大学;2015年
3 齐宝雷;面向不确定图数据的子图模式挖掘算法的研究与实现[D];东北大学;2013年
4 王会会;精确子图数据库查询技术研究[D];哈尔滨工业大学;2014年
5 白杨;复杂网络图中高密度子图检测方法与实现[D];西安电子科技大学;2014年
6 王鹏;基于局部邻域的最大密度子图检测方法研究与实现[D];西安电子科技大学;2014年
7 赵路;图的Q-特征值与图结构[D];青海师范大学;2015年
8 王璐璐;不确定图上Top-k子图相似性查询技术研究[D];东北大学;2014年
9 张天明;大图上频繁子图挖掘算法的研究[D];东北大学;2014年
10 王峰;基于众核平台子图匹配算法研究[D];北京理工大学;2016年
,本文编号:1792932
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1792932.html