当前位置:主页 > 科技论文 > 软件论文 >

改进的Spark Shuffle内存分配算法

发布时间:2018-04-10 02:27

  本文选题:Apache 切入点:Spark 出处:《计算机应用》2017年12期


【摘要】:Shuffle性能是影响大数据集群性能的重要指标,Spark自身的Shuffle内存分配算法试图为内存池中的每一个Task平均分配内存,但是在实验中发现,由于各Task对于内存需求的不均衡导致了内存的浪费和运行效率较低的问题。针对上述问题,提出一种改进的Spark Shuffle内存分配算法。该算法根据Task的内存申请量和历史运行数据将Task按内存需求分为大小两类,对小内存需求型Task作"分割化"处理,对大内存需求型Task基于Task溢出次数和溢出后等待时间分配内存。该算法充分利用内存池的空闲内存,可以在数据倾斜导致的Task内存需求不均衡的情况下进行Task内存分配的自适应调节。实验结果表明,改进后算法较原算法降低了Task的溢出率,减少了Task的周转时间,提高了集群的运行性能。
[Abstract]:Shuffle performance is an important indicator affecting big data's cluster performance. Spark's own Shuffle memory allocation algorithm tries to allocate memory equally for each Task in the memory pool, but it is found in the experiment.Due to the imbalance of memory requirements in Task, memory is wasted and inefficient.To solve the above problems, an improved Spark Shuffle memory allocation algorithm is proposed.According to the memory application amount and the historical running data of Task, the Task is divided into two categories according to the memory requirement, and the small memory demand type Task is "partitioned".For large memory Task based on Task overflow times and after overflow wait time allocation of memory.This algorithm makes full use of the free memory of memory pool and can adjust the Task memory allocation adaptively under the condition that the demand of Task memory caused by data skew is not balanced.The experimental results show that compared with the original algorithm, the improved algorithm reduces the overflow rate of Task, reduces the turnover time of Task, and improves the performance of the cluster.
【作者单位】: 中国民航大学计算机科学与技术学院;
【基金】:国家自然科学基金资助项目(U1533104)~~
【分类号】:TP301.6;TP333

【相似文献】

相关期刊论文 前10条

1 肖济楷;386/486微机在系统优化中的内存处理技术[J];武汉钢铁学院学报;1995年02期

2 周宾;章勇;;嵌入式Web访问时的内存丢失问题[J];单片机与嵌入式系统应用;2009年10期

3 邵刚;使自己的应用程序有“用不完”的内存(二)[J];电子与电脑;1996年02期

4 卢春鹏;一种嵌入式系统的内存分配方案[J];单片机与嵌入式系统应用;2002年12期

5 靳广斌,曹焕林;内存的利用和优化以及系统的典型配置[J];电力学报;1995年03期

6 谢晓恒,李卫华;利用扩充内存实现多幅图象的快速存储[J];计算机应用研究;1997年02期

7 王路群;;微机内存的综合管理[J];成才;1997年01期

8 程小辉;何军权;梁启亮;黄佳欢;顾俊杰;;基于预测原理的嵌入式内存分配算法设计[J];计算机工程与设计;2014年09期

9 薛静锋;胡昌振;郭晓静;冷冰p,

本文编号:1729263


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1729263.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8b1f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com