分布式图计算框架混合计算模式的研究
本文选题:分布式 + 图计算 ; 参考:《小型微型计算机系统》2015年04期
【摘要】:分析了分布式图计算框架的同步和异步计算模式在调度开销和收敛速度上存在的优点与不足.同步计算模式调度开销小,但是收敛较慢;而异步计算模式收敛较快,但调度开销大.基于上述发现,提出一种混合计算模式,能够在分布式环境下有效地结合同步与异步计算模式的优点克服各自不足,以获得最优性能.混合计算模式采用"同步控制流"以降低分布式环境下的调度开销,同时采用"异步数据流"使计算过程使用较新的数据以加快收敛速度.基于多个典型图算法和真实大规模图的评测显示,混合计算模式的性能是原有同步计算模式的1.2倍到2.4倍,计算量平均减少30%;相对于异步计算模式通过减少调度开销,整体性能可以提升至其2.3倍到4.6倍.
[Abstract]:The advantages and disadvantages of the synchronous and asynchronous computing models in the distributed graph computing framework in scheduling overhead and convergence speed are analyzed. The scheduling cost of synchronous computing mode is small, but the convergence is slow, while the asynchronous computing mode converges faster, but the scheduling overhead is large. Based on the above findings, a hybrid computing model is proposed, which can effectively combine the advantages of synchronous and asynchronous computing modes in distributed environments to overcome their respective shortcomings to achieve optimal performance. The hybrid computing model uses "synchronous control flow" to reduce the scheduling overhead in distributed environment, and "asynchronous data stream" to make the computing process use newer data to speed up the convergence. The performance of the hybrid computing model is 1.2 to 2.4 times of that of the original synchronous computing model, and the average amount of computation is reduced by 30 times compared with the asynchronous computing mode, and the scheduling overhead is reduced compared with the asynchronous computing mode. The overall performance can be increased to 2.3 to 4.6 times.
【作者单位】: 复旦大学软件学院上海市数据科学重点实验室;上海交通大学软件学院并行与分布式系统研究所;
【基金】:国家自然科学基金青年项目(61003002)资助 教育部新教师博士点基金项目(20130073120040)资助
【分类号】:TP338.8
【参考文献】
相关期刊论文 前1条
1 于戈;谷峪;鲍玉斌;王志刚;;云计算环境下的大规模图数据处理技术[J];计算机学报;2011年10期
【共引文献】
相关期刊论文 前10条
1 王晟;赵壁芳;;面向云计算的数据管理技术研究[J];电脑知识与技术;2012年13期
2 宋亚奇;刘树仁;朱永利;王德文;李莉;;电力设备状态高速采样数据的云存储技术研究[J];电力自动化设备;2013年10期
3 郎波;张博宇;;面向大数据的非结构化数据管理平台关键技术[J];信息技术与标准化;2013年10期
4 邵景峰;崔尊民;王进富;白晓波;;大数据下纺织制造执行系统的构建[J];纺织器材;2013年06期
5 张亚楠;谭跃生;;基于MapReduce的并行遮盖文本聚类算法[J];内蒙古科技大学学报;2013年03期
6 周国亮;朱永利;王桂兰;;CC-MRSJ:Hadoop平台下缓存敏感的星型联接算法[J];电信科学;2013年10期
7 王鹏;黄焱;刘峰;安俊秀;;大数据技术中计算与数据的协作机制[J];成都信息工程学院学报;2014年01期
8 杜政颉;王鹏;黄焱;郎福通;;一种基于Storm编程模型的迭代Topology方案[J];成都信息工程学院学报;2014年01期
9 范飞;黄文明;邓珍荣;;Oozie工作流在Mahout分布式数据挖掘中的应用[J];桂林电子科技大学学报;2014年01期
10 刘嵩;谢晓尧;;3D点云BSP并行计算模型及算法设计[J];贵州大学学报(自然科学版);2014年01期
相关会议论文 前5条
1 乔媛媛;刘芳;凌艳;尹劲松;;云计算环境下MapReduce的资源建模与性能预测[A];2013年全国通信软件学术会议论文集[C];2013年
2 Xiaoguang Han;Jigang Sun;Wu Qu;Xuanxia Yao;;Distributed Malware Detection based on Binary File Features in Cloud Computing Environment[A];第26届中国控制与决策会议论文集[C];2014年
3 陈佐旗;余柏蒗;吴健平;;基于GPU通用计算的遥感数据处理——以计算地表太阳辐射值为例[A];第十八届中国环境遥感应用技术论坛论文集[C];2014年
4 白永超;付伟;辛阳;;基于Hadoop和Nutch的分布式搜索引擎研究与仿真[A];第十九届全国青年通信学术年会论文集[C];2014年
5 李超越;徐国胜;;Hadoop公平调度算法的改进[A];第十九届全国青年通信学术年会论文集[C];2014年
相关博士学位论文 前10条
1 郭红方;视频点播内容分发关键技术研究[D];郑州大学;2012年
2 王锋;基于粒化机理的粗糙特征选择高效算法研究[D];山西大学;2013年
3 杨雅君;动态图数据挖掘与查询算法的研究[D];哈尔滨工业大学;2013年
4 李健;云计算环境下最小化运营开销的调度技术研究[D];北京邮电大学;2013年
5 张帆;认知可重构的高效能Web服务体系结构研究[D];解放军信息工程大学;2013年
6 王金宝;云计算系统中索引与查询处理技术研究[D];哈尔滨工业大学;2013年
7 韩晶;大数据服务若干关键技术研究[D];北京邮电大学;2013年
8 程祥;高效可靠的虚拟网络映射技术研究[D];北京邮电大学;2013年
9 李韧;基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究[D];重庆大学;2013年
10 卢风顺;面向CPU/GPU异构体系结构的并行计算关键技术研究[D];国防科学技术大学;2012年
相关硕士学位论文 前10条
1 孙春菊;云环境下数据模型和索引技术研究[D];南京邮电大学;2013年
2 m云龙;云计算平台下的数据挖掘研究[D];南京邮电大学;2013年
3 许伟静;云计算在媒体资源管理系统中的应用研究[D];北京化工大学;2013年
4 赵男;基于MapReduce的分布式极图构造算法研究[D];北京交通大学;2013年
5 刘树仁;基于Hadoop的电力设备状态监测数据存储与访问研究[D];华北电力大学;2013年
6 陈贞;HDFS环境下的访问控制技术研究[D];重庆大学;2013年
7 张丹;HDFS中文件存储优化的相关技术研究[D];南京师范大学;2013年
8 潘吴斌;基于云计算的并行K-means气象数据挖掘研究与应用[D];南京信息工程大学;2013年
9 赵洪昌;云计算下的关联分析和模糊聚类研究[D];南京信息工程大学;2013年
10 汪洋;通信网云计算平台资源调度策略与算法研究[D];南昌大学;2013年
,本文编号:1931943
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1931943.html