当前位置:主页 > 科技论文 > 自动化论文 >

云计算中MapReduce的性能优化研究

发布时间:2018-07-05 16:00

  本文选题:云计算 + MapReduce ; 参考:《南京邮电大学》2017年硕士论文


【摘要】:随着信息技术的快速发展和普及应用,大规模的数据处理需求日益增加,传统的并行计算机在存储空间和计算资源方面难以满足海量数据处理的需求,因此云计算技术为解决海量数据处理提供了良好的环境。MapReduce编程模型为云计算进行海量数据处理提供了新的思路,它克服了传统分布式并行程序编写复杂的缺点,提供了简化的编写方式。但是MapReduce编程模型的性能上仍然存在一些问题,因此本文从任务调度的角度对MapReduce的性能进行优化。本文研究的主要内容是:首先对云计算和Hadoop平台进行简单介绍,重点研究MapReduce计算模型和任务调度算法,在分析MapReduce调度算法不足的基础上,提出了蚁群模拟退火算法,在该算法中,以减少任务的完成时间和保证资源负载均衡为目标,根据蚁群算法构造局部最优解,将蚁群算法的局部最优解作为模拟退火算法的初始解进行全局搜索,并根据Metropolis准则判断是否接受当前解。针对MapReduce编程模型中的容错技术的缺点,本文提出引入失效恢复机制的可靠性任务调度策略,对云环境中的资源节点进行可信任度评估,建立可信任度模型,根据可信任度模型为任务分配可靠的节点,避免任务失败重新分配执行,浪费时间和资源。最后,通过仿真平台CloudSim验证了本文提出的任务调度算法和调度模型的有效性和稳定性。
[Abstract]:With the rapid development and widespread application of information technology, the demand for large-scale data processing is increasing day by day. Traditional parallel computers are unable to meet the requirements of mass data processing in storage space and computing resources. Therefore, cloud computing technology provides a good environment for mass data processing. MapReduce programming model provides a new way for cloud computing to process mass data. It overcomes the complex shortcomings of traditional distributed parallel programs. A simplified way of writing is provided. However, there are still some problems in the performance of MapReduce programming model, so this paper optimizes the performance of MapReduce from the perspective of task scheduling. The main contents of this paper are as follows: firstly, the cloud computing and Hadoop platforms are briefly introduced, and the MapReduce computing model and task scheduling algorithm are studied. Based on the analysis of the lack of MapReduce scheduling algorithm, an ant colony simulated annealing algorithm is proposed. In order to reduce the completion time of the task and ensure the resource load balance, the local optimal solution of the ant colony algorithm is constructed according to the ant colony algorithm, and the local optimal solution of the ant colony algorithm is considered as the initial solution of the simulated annealing algorithm. The Metropolis criterion is used to determine whether the current solution is acceptable or not. Aiming at the shortcomings of fault-tolerant technology in MapReduce programming model, this paper proposes a reliability task scheduling strategy based on failure recovery mechanism, evaluates the trust degree of resource nodes in cloud environment, and establishes a trust degree model. A reliable node is assigned to the task according to the trust model to avoid the task failure redistribution and waste of time and resources. Finally, the effectiveness and stability of the proposed task scheduling algorithm and scheduling model are verified by the simulation platform CloudSim.
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP3;TP18

【参考文献】

相关期刊论文 前10条

1 郑晓薇;项明;张大为;刘青昆;;基于节点能力的Hadoop集群任务自适应调度方法[J];计算机研究与发展;2014年03期

2 傅杰;都志辉;;一种周期性MapReduce作业的负载均衡策略[J];计算机科学;2013年03期

3 许丞;刘洪;谭良;;Hadoop云平台的一种新的任务调度和监控机制[J];计算机科学;2013年01期

4 刘玮;王丽宏;;云计算应用及其安全问题研究[J];计算机研究与发展;2012年S2期

5 李奇原;刘杰;叶丹;许舒人;;FlowS:一种MapReduce数据流公平调度方法[J];计算机科学;2012年09期

6 余正祥;;基于学习方式对Hadoop作业调度的改进研究[J];计算机科学;2012年S1期

7 崔杰;李陶深;兰红星;;基于Hadoop的海量数据存储平台设计与开发[J];计算机研究与发展;2012年S1期

8 李建江;崔健;王聃;严林;黄义双;;MapReduce并行编程模型研究综述[J];电子学报;2011年11期

9 李丽英;唐卓;李仁发;;基于LATE的Hadoop数据局部性改进调度算法[J];计算机科学;2011年11期

10 顾宇;周良;丁秋林;;基于优先级的Three-Queue调度算法研究[J];计算机科学;2011年S1期

相关博士学位论文 前1条

1 王玉林;多节点容错存储系统的数据与缓存组织研究[D];电子科技大学;2010年

相关硕士学位论文 前3条

1 陆路;云环境下作业调度算法研究[D];南京理工大学;2013年

2 赵春燕;云环境下作业调度算法研究与实现[D];北京交通大学;2009年

3 汪采萍;蚁群算法的应用研究[D];合肥工业大学;2007年



本文编号:2100808

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2100808.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7e36e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com