基于PowerGraph并行计算框架的社会网络分析研究
本文选题:PowerGraph 切入点:社会网络 出处:《河北师范大学》2017年硕士论文
【摘要】:图是一种基本的数据结构,能够体现出不同实体之间的关系。在不同的应用领域中,图被广泛用来表示十分复杂的数据,比如:社会网络、蛋白质网络、运输网络、书目网络以及更多其他网络。如今,个人、社区、组织、国家等行动者之间的关系越来越紧密,这些关系中所蕴含的有价值的信息也随之飞速增长,使得社会网络分析的研究日趋火热。一般而言,社会网络分析是一种重要的大数据发现技术。当前,拥有百万、甚至亿万节点和边的大规模社会网络已十分普遍,为了处理和分析大规模网络出现了一些符合其计算特点的分布式图并行计算平台。然而,由于许多社会网络分析的经典算法都是基于单机设计的集中式算法,无法满足大规模社会网络分析的需求。因此,本文着重从社会网络传播、矩阵分解、网络重构这三方面入手,在PowerGraph图并行计算框架下设计并实现并行图数据分析算法。本文主要完成了以下几个方面的工作:1)基于PowerGraph的并行传播算法病毒的蔓延、信息的扩散等,都可以看成是服从某种规律的网络传播行为。通过传播模型,可以模仿这些传播行为,有助于人们理解传播机制。传播模型有很多种,对不同的病毒或信息,适用的传播模型也不相同,经典的传播模型有SIS、SIR、SIRS、SEIR。本文基于PowerGraph提出面向SEIR模型的并行传播算法PSA-SEIR(Parallel Spreading Algorithm for SEIR Model)。经实验验证,仿真结果与SEIR模型的传播趋势相符,同时分析了算法的可扩展性。2)基于PowerGraph的并行矩阵分解(SVD++)算法在社会网络分析中,矩阵分解是常见的方法。由于许多网络都可以抽象为矩阵的形式,社会网络分析的算法可以以矩阵计算的方式实现。因此,了解并实现对大规模稀疏矩阵的分解,能够解决许多现实问题(如:电影推荐)。基于此,改进了并行SVD++算法,基于PowerGraph提出学习率可调的并行SVD++算法LRA-PSVD++(Learning Rate Adjustment Parallel SVD++Algorithm)。经实验验证,LRA-PSVD++提高了算法精度,此外,实验证明了算法具有可扩展性。3)基于PowerGraph的并行重构算法网络的拓扑结构与其许多基本特征有很大关系。同配性是网络宏观拓扑的一个重要特征,同配性的改变意味着网络拓扑结构的改变。通过网络重构,构造出具有不同同配系数的网络,有助于分析同配性对网络其他特征(如:传播特征、鲁棒性)的影响。基于此,以增强网络同配性为目标,在保持度序列不变的条件下提出了基于PowerGraph的并行随机重构算法PRRWA(Parallel Random Rewiring Algorithm)。通过实验对算法的可行性与可扩展性进行了分析。
[Abstract]:A graph is a basic data structure that can reflect the relationships between different entities.In a variety of applications, graphs are widely used to represent very complex data, such as social networks, protein networks, transport networks, bibliographic networks, and more.Nowadays, the relationship among individual, community, organization, state and other actors is getting closer and closer. The valuable information contained in these relationships is also increasing rapidly, which makes the research of social network analysis become more and more hot.Generally speaking, social network analysis is an important big data discovery technology.At present, large-scale social networks with millions, even billions of nodes and edges are very common. In order to deal with and analyze large-scale networks, there are some distributed graph parallel computing platforms which accord with its computing characteristics.However, because many classical algorithms of social network analysis are centralized algorithms based on single computer, they can not meet the needs of large-scale social network analysis.Therefore, this paper focuses on the three aspects of social network propagation, matrix decomposition and network reconstruction, and designs and implements the parallel graph data analysis algorithm under the PowerGraph graph parallel computing framework.The main work of this paper is as follows: 1) the spread of virus and information in parallel communication algorithm based on PowerGraph can be regarded as the behavior of spreading from a certain law.Through the communication model, we can imitate these communication behaviors and help people understand the communication mechanism.There are many kinds of transmission models, and the transmission models are different for different viruses or information. The classical transmission models are SISSIRS / SIRS / SEIRs.Based on PowerGraph, a parallel propagation algorithm for SEIR model, PSA-SEIR(Parallel Spreading Algorithm for SEIR Modeler, is proposed in this paper.Experimental results show that the simulation results are consistent with the propagation trend of the SEIR model. At the same time, the extensibility of the algorithm is analyzed. 2) the parallel matrix decomposition algorithm based on PowerGraph is a common method in social network analysis.Because many networks can be abstracted as matrices, the algorithm of social network analysis can be realized by matrix calculation.Therefore, understanding and implementing the decomposition of large sparse matrices can solve many practical problems (such as: film recommendation).Based on this, the parallel SVD algorithm is improved, and the LRA-PSVD Rate Adjustment Parallel SVD algorithm with adjustable learning rate is proposed based on PowerGraph.Experimental results show that LRA-PSVD improves the accuracy of the algorithm. In addition, it is proved that the algorithm is extensible. 3) the topological structure of parallel reconstruction algorithm network based on PowerGraph is closely related to its many basic characteristics.Homogeneity is an important feature of network macro topology, and the change of homogeneity means the change of network topology.Through network reconstruction, a network with different matching coefficients is constructed, which is helpful to analyze the influence of homogeneity on other features of the network, such as propagation characteristics and robustness.Based on this, a parallel random reconstruction algorithm based on PowerGraph, PRRWA(Parallel Random Rewiring algorithm, is proposed to enhance the network homogeneity under the condition of invariant degree sequence.The feasibility and expansibility of the algorithm are analyzed through experiments.
【学位授予单位】:河北师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O157.5;TP311.13
【相似文献】
相关期刊论文 前10条
1 钱少先;关于并行计算的若干问题[J];安庆师范学院学报(自然科学版);2001年02期
2 胡霞;;并行计算如何用于科学问题研究[J];科技资讯;2009年27期
3 李人宪,杨忠超;流场有限元分析的并行计算[J];应用力学学报;2002年02期
4 王琥,李光耀,钟志华;有限元并行计算中网格自动分区的优化[J];工程力学;2005年S1期
5 郑敏娟;贺炎;;未来的并行计算[J];中国科技信息;2007年12期
6 张军;谭俊杰;任登凤;;二维含动边界流场的并行计算[J];河海大学学报(自然科学版);2007年04期
7 曹伟;;并行计算基础和实际应用[J];辽宁师专学报(自然科学版);2008年03期
8 陈国良;孙广中;徐云;龙柏;;并行计算的一体化研究现状与发展趋势[J];科学通报;2009年08期
9 王琳;鲁晶晶;殷克功;;关于并行计算在软件发展下的研究分析[J];科技信息;2009年14期
10 刘俊莉;王楚斌;林晓锐;司徒祝坤;;并行计算实验平台的研究与实现[J];科技信息;2009年22期
相关会议论文 前10条
1 黄宇光;;整体同步并行计算方法的现状与发展[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
2 罗文彩;陈小前;;并行计算的多方法优化协作[A];第二十四届中国控制会议论文集(上册)[C];2005年
3 左风丽;莫则尧;叶文华;;计算流体三维分裂格式的高效并行计算[A];中国工程物理研究院科技年报(2003)[C];2003年
4 王欣;李志山;张志远;;并行计算在弹塑性时程分析中的应用[A];信息化推动工程建设工业化——第四届工程建设计算机应用创新论坛论文集[C];2013年
5 张理涛;黄廷祝;谷同祥;左宪禹;;一种适合于分布式并行计算改进的平方共轭残差法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
6 胡金初;;并行计算中的任务分配算法[A];2005年全国理论计算机科学学术年会论文集[C];2005年
7 宋庭新;李慧;;面向服务的有限元并行计算网格系统设计[A];湖北省机械工程学会设计与传动学会、武汉机械设计与传动学会2008年学术年会论文集(2)[C];2008年
8 裘懿勇;徐斌;刘晓明;;并行计算作业调度系统的架构及应用[A];第十四届中国科协年会第5分会场:绿色船舶与海洋装备创新发展及产业化论坛论文集[C];2012年
9 裘懿勇;徐斌;刘晓明;;并行计算作业调度系统的架构及应用[A];2012年MIS/S&A学术交流会议论文集[C];2012年
10 肖保国;杨顺华;邢建文;赵慧勇;;当地自适应建表方法在煤油超燃发动机并行计算中的应用[A];第十四届全国激波与激波管学术会议论文集(下册)[C];2010年
相关重要报纸文章 前10条
1 轶嘉;英特尔全球首个并行计算中心落户无锡[N];人民邮电;2009年
2 曙光信息产业有限公司研发中心 温鑫;并行计算任重道远[N];中国计算机报;2007年
3 英特尔并行计算实验室研究员 TimothyMattson;并行计算:减少串行软件[N];中国计算机报;2007年
4 曙光信息产业有限公司研发中心 温鑫;并行计算软件开发概述[N];中国计算机报;2007年
5 刘霞;计算能力的提升需要一场革命[N];科技日报;2010年
6 安世亚太 雷先华;ANSYS高性能并行计算[N];中国航空报;2005年
7 张云泉;并行计算:迎接多核时代的挑战[N];计算机世界;2006年
8 本报记者 马文方;英特尔为何要牵头并行计算[N];中国计算机报;2009年
9 英特尔 赵军(Jun Zhao);PC机并行计算革命尚未成功[N];中国计算机报;2009年
10 ;Linux下的网络并行计算[N];计算机世界;2000年
相关博士学位论文 前10条
1 张雨新;改进的MPS方法及其三维并行计算研究[D];上海交通大学;2014年
2 李维山;面向领域应用的空间域和频域分解模式并行计算[D];吉林大学;2016年
3 万烂军;面向新型异构众核系统的多设备协同并行计算关键技术研究[D];湖南大学;2016年
4 孙安香;数值气象预报变分同化的伴随模式并行计算[D];中国人民解放军国防科学技术大学;2002年
5 张理论;面向气象预报数值模式的高效并行计算研究[D];中国人民解放军国防科学技术大学;2002年
6 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年
7 管建和;电磁场有限元法解释分布式并行计算的研究[D];中国地质大学(北京);2006年
8 刘耀儒;三维有限元并行计算及其在水利工程中的应用[D];清华大学;2003年
9 金晶;并行计算普适编程模型及系统架构研究[D];北京邮电大学;2012年
10 盛艳秀;多核异构环境下通用并行计算框架关键技术研究[D];中国海洋大学;2013年
相关硕士学位论文 前10条
1 张康宇;基于ASAR近海风场反演方法研究[D];浙江大学;2015年
2 胡荣华;并行计算在临近天气预报系统中的应用研究[D];华南理工大学;2015年
3 严善楷;异构系统中并行计算的动态负载均衡技术研究[D];华南理工大学;2015年
4 陈磊;基于监控信号的多信息提取识别的并行计算方法[D];南京理工大学;2015年
5 焦弘杰;CPU-GPU异构并行计算体系的设计与实现[D];江苏科技大学;2015年
6 陈从江;基于面向云服务的Python并行计算的研究[D];电子科技大学;2014年
7 唐吉卓;基于GPU平台的SVD并行计算研究与实现[D];电子科技大学;2014年
8 吴颀;GPU并行计算及其在飞行器设计中的应用[D];北京理工大学;2015年
9 李保安;基于液态食品冷冻浓缩冰晶生长机制并行计算[D];电子科技大学;2013年
10 钟承群;基于CPU/GPU异构并行计算的OTN仿真验证系统的研究与实现[D];电子科技大学;2015年
,本文编号:1723655
本文链接:https://www.wllwen.com/kejilunwen/yysx/1723655.html