当前位置:主页 > 科技论文 > 软件论文 >

基于协同边推导的动态流式图并行抽样算法

发布时间:2018-05-05 08:23

  本文选题:动态图 + 流式图 ; 参考:《华中科技大学》2016年硕士论文


【摘要】:随着应用不断深入,在社交网络服务、科学计算仿真等场景中,图数据持续、大量产生,对其进行快速、有效分析具有十分重要的意义。在某些对精确度要求不是很高或者只要求反映部分关键图特性的应用中,采取从原图中抽取具有代表性的子图进行分析的方法,能节省计算资源和提高处理效率。对动态图抽样时,原图的持续变化导致抽样过程中无法获取全图静态数据,故通常采用流式的抽样算法。不过流式抽样算法由于累计迭代特性,抽样过程必须串行,因此当抽样子图规模较大时,抽样过程减速严重,难以保证实时性,而若抽样子图偏小,则难以保证其与原图相似。现有并行抽样算法针对的都是静态图,不适用于动态图,因此需要提出一种并行的流式抽样算法。研究分析典型的流式图抽样算法PIES(Partial-Induce Edge Sampling)及其改进算法PIES-INV,分析PIES并行化方案存在的问题,提出了一种基于协同边推导的动态流式图并行抽样算法PaStS(Parallel Streaming Sampling)。PaStS与PIES-INV采取相同的暂存点替换策略,在并行抽样时,利用全局点信息同步的机制实现动态调整各抽样器的抽样目标大小,以及实现基于全局点集的协同边推导,从而解决流式抽样算法并行化时点和边大量减少的问题。经过在真实动态图数据集和生成图数据集上的测试,PaStS算法相比PIES,在并行度为8时抽样效率能提高15到49倍。PaStS抽样得到的子图在四种图特性的代表性上与PIES-INV比较接近,在多数情况下都比PIES好。但是在度分布较为均匀的图中,PaStS算法在度分布特性和k-core分布特性上不如PIES。另外,PaStS算法在不同数据集上的集聚系数特性上表现比PIES和PIES-INV稳定,在有效直径特性上表现比PIES稳定。图数据快速变化时PaStS仍能保持较好的抽样效果及稳定性。
[Abstract]:With the deepening of applications, in the social network services, scientific computing simulation and other scenarios, graph data continue to be generated in large quantities, it is of great significance to analyze them quickly and effectively. In some applications where the accuracy requirement is not very high or only some key graph characteristics are required to be reflected, the method of extracting representative subgraphs from the original image for analysis can save computing resources and improve processing efficiency. When sampling the dynamic graph, the continuous change of the original map makes it impossible to obtain the static data of the whole graph during the sampling process, so the flow sampling algorithm is usually used. However, because of the accumulative iterative characteristic, the sampling process must be serialized, so the sampling process decelerates seriously when the drawing scale is large, and it is difficult to guarantee the real-time performance of the sampling process, but it is difficult to ensure that the sampling process is similar to the original one if the drawing image is small. The existing parallel sampling algorithms are all static graphs, which are not suitable for dynamic graphs, so we need to propose a parallel flow sampling algorithm. This paper studies and analyzes the typical flow diagram sampling algorithm PIES(Partial-Induce Edge sampling and its improved algorithm PIES-INV, and analyzes the problems of PIES parallelization scheme. In this paper, a parallel sampling algorithm for dynamic flow diagram based on co-edge derivation is proposed. PaStS(Parallel Streaming Sampling).PaStS and PIES-INV adopt the same temporary point replacement strategy. The mechanism of global point information synchronization is used to dynamically adjust the sampling target size of each sampler and to realize the cooperative-edge derivation based on the global point set, thus solving the problem of parallelizing the time points and reducing the edge of the flow sampling algorithm. After testing on real dynamic graph data set and generating graph data set, compared with Piesi, the efficiency of sampling with parallel degree of 8 can be improved by 15 to 49 times. PaStS is similar to PIES-INV in the representativeness of four kinds of graph characteristics. In most cases it is better than PIES. However, in the graph with uniform degree distribution, PaStS algorithm is inferior to Piesi in degree distribution and k-core distribution. In addition, PaStS algorithm is more stable than PIES and PIES-INV in the characteristic of aggregation coefficient on different data sets, and more stable than PIES in the characteristic of effective diameter. PaStS can still maintain good sampling effect and stability when the map data changes rapidly.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 马安光;;棋子问题的算法分析——2003年第11期题解[J];程序员;2004年01期

2 冯舜玺;;新书推荐:《算法分析导论》[J];计算机教育;2006年05期

3 张力,慕晓冬;计算机算法分析浅谈[J];武警工程学院学报;2002年04期

4 马安光;;飞弹问题的算法分析——2003年第10期题解[J];程序员;2003年12期

5 苏运霖;;《算法分析导论》评介[J];计算机教育;2006年07期

6 朱力强;;培养学生创新思维与能力的算法分析案例[J];计算机与信息技术;2007年11期

7 汪菊琴;;几种常见特殊方阵的算法分析与实现[J];无锡职业技术学院学报;2009年05期

8 李涵;;“算法分析与设计”课程教学改革和实践[J];中国电力教育;2010年16期

9 刘宁;管涛;;浅析案例教学法在算法分析与设计课程中的应用[J];科技风;2011年07期

10 胡峰;王国胤;;“算法分析与设计”教学模式探索[J];当代教育理论与实践;2011年12期

相关会议论文 前10条

1 俞洋;田亚菲;;一种新的变步长LMS算法及其仿真[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年

2 周颢;刘振华;赵保华;;构造型的D~2FA生成算法[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年

3 赖桃桃;冯少荣;张东站;;一种基于划分和密度的快速聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

4 刘远新;邓飞其;罗艳辉;舒添慧;;ERP柔性平台下物流运输配送系统算法分析[A];第二十六届中国控制会议论文集[C];2007年

5 王树西;白硕;姜吉发;;模式合一的“减首去尾”算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年

6 王万青;张晓辉;;改进的A~*算法的高效实现[A];2009全国测绘科技信息交流会暨首届测绘博客征文颁奖论文集[C];2009年

7 孙焕良;邱菲;刘俊岭;朱叶丽;;IncSNN——一种基于密度的增量聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

8 韩建民;岑婷婷;于娟;;实现敏感属性l-多样性的l-MDAV算法[A];第二十七届中国控制会议论文集[C];2008年

9 张悦;尤枫;赵瑞莲;;利用蚁群算法实现基于程序结构的主变元分析[A];第五届中国测试学术会议论文集[C];2008年

10 王旭东;刘渝;邓振淼;;正弦波频率估计的修正Rife算法及其FPGA实现[A];全国第十届信号与信息处理、第四届DSP应用技术联合学术会议论文集[C];2006年

相关重要报纸文章 前1条

1 科文;VIXD算法分析Web异常[N];中国计算机报;2008年

相关博士学位论文 前10条

1 魏哲学;样本断点距离问题的算法与复杂性研究[D];山东大学;2015年

2 刘春明;基于增强学习和车辆动力学的高速公路自主驾驶研究[D];国防科学技术大学;2014年

3 张敏霞;生物地理学优化算法及其在应急交通规划中的应用研究[D];浙江工业大学;2015年

4 李红;流程挖掘算法研究[D];云南大学;2015年

5 卜晨阳;演化约束优化及演化动态优化求解算法研究[D];中国科学技术大学;2017年

6 陈拉明;基于非凸优化的稀疏重建理论与算法[D];清华大学;2016年

7 刘新旺;多核学习算法研究[D];国防科学技术大学;2013年

8 于滨;城市公交系统模型与算法研究[D];大连理工大学;2006年

9 曾国强;改进的极值优化算法及其在组合优化问题中的应用研究[D];浙江大学;2011年

10 肖永豪;蜂群算法及在图像处理中的应用研究[D];华南理工大学;2011年

相关硕士学位论文 前10条

1 黄厦;基于改进蚁群算法的柔性作业车间调度问题研究[D];昆明理工大学;2015年

2 李平;基于Hadoop的信息爬取与舆情检测算法研究[D];昆明理工大学;2015年

3 赵官宝;基于位表的关联规则挖掘算法研究[D];昆明理工大学;2015年

4 殷文华;移动容迟网络中基于社会感知的多播分发算法研究[D];内蒙古大学;2015年

5 徐翔燕;人工鱼群优化算法及其应用研究[D];西南交通大学;2015年

6 李德福;基于小世界模型的启发式寻路算法研究[D];华中师范大学;2015年

7 郑海彬;一种面向MAPREDUCE的DATASHUFFLE的优化方法[D];苏州大学;2015年

8 赵晓寒;轮换步长PSO算法及SMVSC参数优化[D];沈阳理工大学;2015年

9 安丰洋;基于无线网络的广播算法研究[D];曲阜师范大学;2015年

10 李智明;基于改进FastICA算法的混合语音盲分离[D];上海交通大学;2015年



本文编号:1846950

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1846950.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fc4aa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com