当前位置:主页 > 科技论文 > 软件论文 >

负载均衡的Hadoop平台调度算法研究

发布时间:2018-07-28 14:43
【摘要】:近年来,随着计算机信息技术的不断发展,数据信息在各个行业已经呈爆炸式增长。据全球互联网中心数据,截止到2020年底,全球数据量预计将达到35ZB。就像人们说的,大数据时代正式到来了。在处理海量数据的关键时刻,云计算技术随之产生,随着技术不断发展,处理大数据的云计算技术已被广泛应用于公司和企业,例如Google、Microsoft、阿里巴巴,这些公司的云计算系统大多基于一个分布式处理软件框架,即hadoop平台。Hadoop是一个安全、可靠、可并行化运行的开放式源代码框架,并且可实现对应用开发者的透明处理,用户并不需要了解hadoop底层实现细节。但毕竟云计算技术研究时间较短,技术研究还不太深入,云计算仍存在一些挑战,例如安全性,性能,资源管理,可靠性等。资源管理问题与任务调度有关,云计算任务调度是指将用户任务分配给可用资源,以改善任务的执行,提高资源利用率。因此通过改进Hadoop平台任务调度方法可以提高Hadoop平台资源利用率和整体性能。作业调度技术是hadoop平台的核心技术,它主要负责将系统中空闲资源分配给各个作业,以及控制作业执行的顺序,它对于hadoop平台计算资源分配及整体性能起着至关重要的作用。因此我们对于作业调度算法的研究具有重要意义。云计算资源的分配是基于SLA服务的,任务执行成本是任务调度算法的主要性能参数之一。另外,任务调度算法被认为是一个复杂的过程,因为它必须充分利用可用资源来执行大量任务。这就需要开发任务调度算法时应考虑许多参数,从用户的角度来看任务编译时间,成本和响应时间非常重要。而从云提供商的角度来看,资源利用率,容错能力和功耗则很重要。本文首先介绍了hadoop平台的背景、结构及hadoop核心技术;然后对单队列调度(FIFO)、容量调度(Capacity)、公平调度(Fair)三种现有的调度算法作了详尽介绍,并在此基础上对如何改进算法的不足、提高系统整体性能作了介绍,最后提出基于遗传算法(GA)的改进任务调度策略用于分配和执行应用程序的任务,以减少任务完成时间,降低执行成本,并最大限度地提高资源利用率。提出的算法的性能已经使用Cloud Sim工具包进行了评估。
[Abstract]:In recent years, with the continuous development of computer information technology, data information has been explosive growth in various industries. According to the Global Internet Center, by the end of 2020, the global data volume is expected to reach 35 ZB. As they say, the big data era is officially coming. With the development of cloud computing technology, cloud computing technology to deal with big data has been widely used in companies and enterprises, such as Google Microsoft, Alibaba, Most of the cloud computing systems of these companies are based on a distributed processing software framework, hadoop platform. Hadoop is a secure, reliable, parallelized open source code framework, and can achieve transparent processing to application developers. Users do not need to know the details of hadoop's underlying implementation. But after all, cloud computing technology research time is short, technology research is not very deep, cloud computing still has some challenges, such as security, performance, resource management, reliability and so on. Resource management is related to task scheduling. Cloud computing task scheduling is to assign user tasks to available resources to improve task execution and resource utilization. Therefore, the resource utilization and overall performance of Hadoop platform can be improved by improving the task scheduling method of Hadoop platform. Job scheduling is the core technology of hadoop platform. It is mainly responsible for allocating free resources to each job in the system and controlling the order of job execution. It plays an important role in computing resource allocation and overall performance of hadoop platform. Therefore, it is of great significance to study the job scheduling algorithm. The allocation of cloud computing resources is based on SLA services, and task execution cost is one of the main performance parameters of task scheduling algorithm. In addition, task scheduling algorithm is considered to be a complex process, because it must make full use of available resources to perform a large number of tasks. Many parameters should be taken into account when developing task scheduling algorithms. From the point of view of the user, the compilation time, cost and response time of the task are very important. From the point of view of cloud provider, resource utilization, fault tolerance and power consumption are very important. This paper first introduces the background, structure and hadoop core technology of hadoop platform, then introduces the three existing scheduling algorithms of (FIFO), capacity scheduling (Capacity), fair scheduling (Fair) in detail, and on the basis of this, gives a detailed description of how to improve the algorithm. Finally, an improved task scheduling strategy based on genetic algorithm (GA) is proposed to allocate and execute the tasks of the application program, in order to reduce the task completion time and the execution cost. And to maximize resource utilization. The performance of the proposed algorithm has been evaluated using the Cloud Sim toolkit.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP301.6

【相似文献】

相关期刊论文 前10条

1 冯刚;马伟;金京林;葛红;鲍苏苏;;一种改进的公平分享调度算法[J];微电子学与计算机;2008年04期

2 向哲,钟玉琢,冼伟铨;一种基于周期合并策略的流调度算法[J];软件学报;2001年08期

3 伊鹏,张兴明,郭云飞;基于输入排队的调度算法[J];计算机工程;2003年19期

4 易云山,桂志波;分组网络中包调度算法研究[J];江苏通信技术;2004年03期

5 任艳颖,张文军,王彬;无线调度算法[J];计算机工程;2004年15期

6 刘越洋,席裕庚;基于两步滚动的单机调度算法研究[J];计算机工程;2004年24期

7 杨梅樾;马祥杰;;输入排队中调度算法的研究[J];信息工程大学学报;2006年02期

8 曾东海;刘海;金士尧;;集群负载调度算法性能评价[J];计算机工程;2006年11期

9 孙力娟;李超;张登银;王汝传;;低速网络中实时补偿型差额循环调度算法的设计和实现[J];电子与信息学报;2006年10期

10 刘东;张春元;;软件容错模型中反向与正向调度算法研究[J];计算机工程与科学;2007年09期

相关会议论文 前10条

1 彭洪;涂凍生;;面向操作的调度算法[A];1994中国控制与决策学术年会论文集[C];1994年

2 罗豪杰;许都;;IEEE 802.16 MAC层上行调度算法[A];四川省通信学会2007年学术年会论文集[C];2007年

3 张遵福;李乐民;;支持QoS的调度算法设计[A];2006中国西部青年通信学术会议论文集[C];2006年

4 姚建波;竺小松;李晶晶;;非对称通信环境中两种广播调度算法的分析与比较[A];中国通信学会第六届学术年会论文集(上)[C];2009年

5 景维鹏;吴智博;刘宏伟;董剑;;一种支持任务依赖关系容错调度算法[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年

6 李琪林;甄威;周明天;;一种适用于Master-Worker应用的动态统一调度算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年

7 吕锋;涂晓东;;高性能交换结构调度算法的研究[A];四川省通信学会2006年学术年会论文集(二)[C];2006年

8 赵尔敦;肖静;;无线网络中基于信道状态预测的调度算法[A];2006全国复杂网络学术会议论文集[C];2006年

9 殷洁;;城市光网光纤自动调度算法研究和应用[A];中国通信学会信息通信网络技术委员会2011年年会论文集(下册)[C];2011年

10 陈平;王柏;徐六通;吴斌;王艳辉;;电信社群网络中介度的网格并行算法及调度算法[A];2006年全国通信软件学术会议论文集[C];2006年

相关重要报纸文章 前1条

1 张建辉 吴松;TD—SCDMA积跬步 HSDPA以致千里[N];通信产业报;2005年

相关博士学位论文 前10条

1 刘晓锋;可扩展多级多平面交换网络及调度算法研究[D];电子科技大学;2015年

2 沈文枫;CPU-GPU异构高性能计算中的负载预测调度算法研究及应用[D];上海大学;2016年

3 胡永东;移动WiMAX网络中跨层的保证QoS解决方案研究[D];东南大学;2017年

4 马丹;任务间相互依赖的并行作业调度算法研究[D];华中科技大学;2007年

5 田冲;无线网络跨层调度算法研究[D];山东大学;2009年

6 黄平;分布式交换系统队列结构及调度算法研究[D];华中科技大学;2006年

7 刘惠;嵌入式系统节能调度算法研究[D];西安电子科技大学;2011年

8 赵明宇;集群系统的调度算法研究[D];哈尔滨工业大学;2007年

9 吴刚;对低功耗进程调度算法的研究[D];复旦大学;2006年

10 牛进平;3G长期演进系统中调度算法和干扰抑制技术研究[D];西安电子科技大学;2014年

相关硕士学位论文 前10条

1 丁雪飞;纯电动车整车CAN网络实时调度算法的研究[D];辽宁大学;2015年

2 王德龙;Hadoop平台下作业调度算法的研究与改进[D];南京信息工程大学;2015年

3 袁林伟;载波聚合资源分配及调度算法研究[D];西南交通大学;2015年

4 景木均;3GPP LTE系统中基于多目标决策的下行资源调度算法研究与实现[D];西南交通大学;2015年

5 刘盼红;大数据环境下Hadoop作业调度算法的研究[D];河北工程大学;2015年

6 杨轩;高铁无线通信VoIP业务与多业务共存的资源调度算法[D];西南交通大学;2015年

7 陈传庆;基于衰落信道的无线链路调度算法研究[D];曲阜师范大学;2015年

8 陈文龙;Hadoop平台下作业调度方法研究[D];南京理工大学;2015年

9 陈瑜;针对Hadoop集群的节能调度算法研究[D];电子科技大学;2015年

10 朱新新;网络端到端流量的QoS优化技术研究[D];电子科技大学;2014年



本文编号:2150572

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2150572.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d84c3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com