负载均衡的Hadoop平台调度算法研究
[Abstract]:In recent years, with the continuous development of computer information technology, data information has been explosive growth in various industries. According to the Global Internet Center, by the end of 2020, the global data volume is expected to reach 35 ZB. As they say, the big data era is officially coming. With the development of cloud computing technology, cloud computing technology to deal with big data has been widely used in companies and enterprises, such as Google Microsoft, Alibaba, Most of the cloud computing systems of these companies are based on a distributed processing software framework, hadoop platform. Hadoop is a secure, reliable, parallelized open source code framework, and can achieve transparent processing to application developers. Users do not need to know the details of hadoop's underlying implementation. But after all, cloud computing technology research time is short, technology research is not very deep, cloud computing still has some challenges, such as security, performance, resource management, reliability and so on. Resource management is related to task scheduling. Cloud computing task scheduling is to assign user tasks to available resources to improve task execution and resource utilization. Therefore, the resource utilization and overall performance of Hadoop platform can be improved by improving the task scheduling method of Hadoop platform. Job scheduling is the core technology of hadoop platform. It is mainly responsible for allocating free resources to each job in the system and controlling the order of job execution. It plays an important role in computing resource allocation and overall performance of hadoop platform. Therefore, it is of great significance to study the job scheduling algorithm. The allocation of cloud computing resources is based on SLA services, and task execution cost is one of the main performance parameters of task scheduling algorithm. In addition, task scheduling algorithm is considered to be a complex process, because it must make full use of available resources to perform a large number of tasks. Many parameters should be taken into account when developing task scheduling algorithms. From the point of view of the user, the compilation time, cost and response time of the task are very important. From the point of view of cloud provider, resource utilization, fault tolerance and power consumption are very important. This paper first introduces the background, structure and hadoop core technology of hadoop platform, then introduces the three existing scheduling algorithms of (FIFO), capacity scheduling (Capacity), fair scheduling (Fair) in detail, and on the basis of this, gives a detailed description of how to improve the algorithm. Finally, an improved task scheduling strategy based on genetic algorithm (GA) is proposed to allocate and execute the tasks of the application program, in order to reduce the task completion time and the execution cost. And to maximize resource utilization. The performance of the proposed algorithm has been evaluated using the Cloud Sim toolkit.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP301.6
【相似文献】
相关期刊论文 前10条
1 冯刚;马伟;金京林;葛红;鲍苏苏;;一种改进的公平分享调度算法[J];微电子学与计算机;2008年04期
2 向哲,钟玉琢,冼伟铨;一种基于周期合并策略的流调度算法[J];软件学报;2001年08期
3 伊鹏,张兴明,郭云飞;基于输入排队的调度算法[J];计算机工程;2003年19期
4 易云山,桂志波;分组网络中包调度算法研究[J];江苏通信技术;2004年03期
5 任艳颖,张文军,王彬;无线调度算法[J];计算机工程;2004年15期
6 刘越洋,席裕庚;基于两步滚动的单机调度算法研究[J];计算机工程;2004年24期
7 杨梅樾;马祥杰;;输入排队中调度算法的研究[J];信息工程大学学报;2006年02期
8 曾东海;刘海;金士尧;;集群负载调度算法性能评价[J];计算机工程;2006年11期
9 孙力娟;李超;张登银;王汝传;;低速网络中实时补偿型差额循环调度算法的设计和实现[J];电子与信息学报;2006年10期
10 刘东;张春元;;软件容错模型中反向与正向调度算法研究[J];计算机工程与科学;2007年09期
相关会议论文 前10条
1 彭洪;涂凍生;;面向操作的调度算法[A];1994中国控制与决策学术年会论文集[C];1994年
2 罗豪杰;许都;;IEEE 802.16 MAC层上行调度算法[A];四川省通信学会2007年学术年会论文集[C];2007年
3 张遵福;李乐民;;支持QoS的调度算法设计[A];2006中国西部青年通信学术会议论文集[C];2006年
4 姚建波;竺小松;李晶晶;;非对称通信环境中两种广播调度算法的分析与比较[A];中国通信学会第六届学术年会论文集(上)[C];2009年
5 景维鹏;吴智博;刘宏伟;董剑;;一种支持任务依赖关系容错调度算法[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
6 李琪林;甄威;周明天;;一种适用于Master-Worker应用的动态统一调度算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 吕锋;涂晓东;;高性能交换结构调度算法的研究[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
8 赵尔敦;肖静;;无线网络中基于信道状态预测的调度算法[A];2006全国复杂网络学术会议论文集[C];2006年
9 殷洁;;城市光网光纤自动调度算法研究和应用[A];中国通信学会信息通信网络技术委员会2011年年会论文集(下册)[C];2011年
10 陈平;王柏;徐六通;吴斌;王艳辉;;电信社群网络中介度的网格并行算法及调度算法[A];2006年全国通信软件学术会议论文集[C];2006年
相关重要报纸文章 前1条
1 张建辉 吴松;TD—SCDMA积跬步 HSDPA以致千里[N];通信产业报;2005年
相关博士学位论文 前10条
1 刘晓锋;可扩展多级多平面交换网络及调度算法研究[D];电子科技大学;2015年
2 沈文枫;CPU-GPU异构高性能计算中的负载预测调度算法研究及应用[D];上海大学;2016年
3 胡永东;移动WiMAX网络中跨层的保证QoS解决方案研究[D];东南大学;2017年
4 马丹;任务间相互依赖的并行作业调度算法研究[D];华中科技大学;2007年
5 田冲;无线网络跨层调度算法研究[D];山东大学;2009年
6 黄平;分布式交换系统队列结构及调度算法研究[D];华中科技大学;2006年
7 刘惠;嵌入式系统节能调度算法研究[D];西安电子科技大学;2011年
8 赵明宇;集群系统的调度算法研究[D];哈尔滨工业大学;2007年
9 吴刚;对低功耗进程调度算法的研究[D];复旦大学;2006年
10 牛进平;3G长期演进系统中调度算法和干扰抑制技术研究[D];西安电子科技大学;2014年
相关硕士学位论文 前10条
1 丁雪飞;纯电动车整车CAN网络实时调度算法的研究[D];辽宁大学;2015年
2 王德龙;Hadoop平台下作业调度算法的研究与改进[D];南京信息工程大学;2015年
3 袁林伟;载波聚合资源分配及调度算法研究[D];西南交通大学;2015年
4 景木均;3GPP LTE系统中基于多目标决策的下行资源调度算法研究与实现[D];西南交通大学;2015年
5 刘盼红;大数据环境下Hadoop作业调度算法的研究[D];河北工程大学;2015年
6 杨轩;高铁无线通信VoIP业务与多业务共存的资源调度算法[D];西南交通大学;2015年
7 陈传庆;基于衰落信道的无线链路调度算法研究[D];曲阜师范大学;2015年
8 陈文龙;Hadoop平台下作业调度方法研究[D];南京理工大学;2015年
9 陈瑜;针对Hadoop集群的节能调度算法研究[D];电子科技大学;2015年
10 朱新新;网络端到端流量的QoS优化技术研究[D];电子科技大学;2014年
,本文编号:2150572
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2150572.html