云平台下自适应调度算法的研究与改进
本文选题:云计算 + Hadoop ; 参考:《太原理工大学》2014年硕士论文
【摘要】:近年来,云计算发展迅猛,众多rr巨头相继开发相应的云计算产品和服务。截止2013年,全球云计算市场规模已经超过1000亿美元。在我国,云计算产业同样得到了金融、医疗、教育、电信、电力等行业的高度重视。随着4G网络的建设,云计算在国内外的研究和发展会得到前所未有的发展。在云计算的关键技术中,资源调度作为一项研究热点得到了广大学者的关注,调度的效率直接影响到集群的整体性能与资源利用率。当前云计算环境具有动态、异构和海量多类型任务并发等特征,随着集群规模不断增大、用户QoS不断增多,现有调度算法越来越难以适应动态变化的环境、难以满足用户的需求,因此,提高云计算环境下作业调度器的自适应性和用户满意度,能够更加有效地利用资源,满足实际需求。通过深入调研,本文首先简要介绍了云计算平台Hadoop的体系结构,包括其核心技术MapReduce编程模型和HDFS文件存储系统。然后按照作业的生命周期,从“作业提交与初始化”、"JobTracker的功能”、"TaskTracker的功能”、“调度模块的作用”四个方面对云平台下的作业调度流程进行了详细分析。此外,本文对Hadoop平台下现有的先进先出调度器(FIFO Scheduler)、公平调度器(Fair Scheduler)、计算能力调度器(Capacity Scheduler)进行了研究。其中,先进先出调度器简单快捷,但不适用于多类型作业共享集群资源,也没有考虑不同用户不同作业的需求差异;公平调度器支持多作业共享集群,提高了作业并行度和用户服务质量,但在杀死任务时没有考虑数据本地化和作业特征,会形成大量的数据移动,增加网络负载;计算能力调度器同样支持多作业共享集群,根据作业性能进行资源分配,但易陷入局部最优。此外,公平调度器和计算能力调度器的优化配置需要在集群启动前静态设置,不能根据作业运行状态和资源使用情况进行动态调整。本文针对上述问题,提出了Hadoop下基于作业分类的自适应调度算法。该算法首先使用朴素贝叶斯分类的机器学习算法将队列中的作业分为运行作业和等待作业。然后,又根据当前资源使用情况和Map-shuffle阶段不同类型作业的的CPU和I/O的利用率的不同,制定了一个过载规则。过载规则用于判断上次任务分配是否会造成集群过载,并把结果反馈给朴素贝叶斯分类器。此外,针对可能出现的分类结果相同的情况,本文引入效用函数,根据用户提交时的预期完成时间QoS和作业完成情况估算其作业完成时间,实现动态设置作业优先级。最后,由调度器选择优先级最高的作业进行调度。本文提出的调度算法正是通过不断从上一次任务分配中吸取经验的方式,动态调整下一轮作业分类和任务分配,进而实现考虑了预期完成时间QoS的作业自适应调度。最后,本文对提出的调度算法进行了编程实现和实验验证,实验结果表明:与传统调度算法相比,本文的算法通过消耗一定时间来不断学习,提高了调度算法的自适应性和数据本地化。与原有自适应调度算法相比,改进的调度算法提高了CPU利用率和调度效率,具有更短响应时间和更高的用户满意度,集群资源也得到了充分利用。
[Abstract]:In recent years , cloud computing has developed rapidly , and many rr giants have developed the corresponding cloud computing products and services successively . As of 2013 , cloud computing industry has received great attention in the industry of financial , medical , education , telecom and electricity .
Fair scheduler supports multi - job sharing cluster , improves job parallelism and user ' s quality of service , but does not consider data localization and job characteristics when killing tasks , which can form large amount of data movement and increase network load ;
This paper puts forward an adaptive scheduling algorithm based on job classification . In addition , according to the current resource usage situation and the utilization ratio of CPU and I / O in different types of jobs in Map - shuffle phase , this paper proposes an adaptive scheduling algorithm based on job classification . In the end , the algorithm improves CPU utilization and scheduling efficiency , and has shorter response time and higher user satisfaction .
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09;TP301.6
【相似文献】
相关期刊论文 前10条
1 向哲,钟玉琢,冼伟铨;一种基于周期合并策略的流调度算法[J];软件学报;2001年08期
2 伊鹏,张兴明,郭云飞;基于输入排队的调度算法[J];计算机工程;2003年19期
3 易云山,桂志波;分组网络中包调度算法研究[J];江苏通信技术;2004年03期
4 任艳颖,张文军,王彬;无线调度算法[J];计算机工程;2004年15期
5 刘越洋,席裕庚;基于两步滚动的单机调度算法研究[J];计算机工程;2004年24期
6 杨梅樾;马祥杰;;输入排队中调度算法的研究[J];信息工程大学学报;2006年02期
7 曾东海;刘海;金士尧;;集群负载调度算法性能评价[J];计算机工程;2006年11期
8 孙力娟;李超;张登银;王汝传;;低速网络中实时补偿型差额循环调度算法的设计和实现[J];电子与信息学报;2006年10期
9 刘东;张春元;;软件容错模型中反向与正向调度算法研究[J];计算机工程与科学;2007年09期
10 何琨;赵勇;黄文奇;;基于任务复制的分簇与调度算法[J];计算机学报;2008年05期
相关会议论文 前10条
1 彭洪;涂凍生;;面向操作的调度算法[A];1994中国控制与决策学术年会论文集[C];1994年
2 罗豪杰;许都;;IEEE 802.16 MAC层上行调度算法[A];四川省通信学会2007年学术年会论文集[C];2007年
3 张遵福;李乐民;;支持QoS的调度算法设计[A];2006中国西部青年通信学术会议论文集[C];2006年
4 姚建波;竺小松;李晶晶;;非对称通信环境中两种广播调度算法的分析与比较[A];中国通信学会第六届学术年会论文集(上)[C];2009年
5 景维鹏;吴智博;刘宏伟;董剑;;一种支持任务依赖关系容错调度算法[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年
6 李琪林;甄威;周明天;;一种适用于Master-Worker应用的动态统一调度算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 吕锋;涂晓东;;高性能交换结构调度算法的研究[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
8 赵尔敦;肖静;;无线网络中基于信道状态预测的调度算法[A];2006全国复杂网络学术会议论文集[C];2006年
9 殷洁;;城市光网光纤自动调度算法研究和应用[A];中国通信学会信息通信网络技术委员会2011年年会论文集(下册)[C];2011年
10 陈平;王柏;徐六通;吴斌;王艳辉;;电信社群网络中介度的网格并行算法及调度算法[A];2006年全国通信软件学术会议论文集[C];2006年
相关重要报纸文章 前1条
1 张建辉 吴松;TD—SCDMA积跬步 HSDPA以致千里[N];通信产业报;2005年
相关博士学位论文 前10条
1 刘晓锋;可扩展多级多平面交换网络及调度算法研究[D];电子科技大学;2015年
2 马丹;任务间相互依赖的并行作业调度算法研究[D];华中科技大学;2007年
3 田冲;无线网络跨层调度算法研究[D];山东大学;2009年
4 黄平;分布式交换系统队列结构及调度算法研究[D];华中科技大学;2006年
5 刘惠;嵌入式系统节能调度算法研究[D];西安电子科技大学;2011年
6 赵明宇;集群系统的调度算法研究[D];哈尔滨工业大学;2007年
7 吴刚;对低功耗进程调度算法的研究[D];复旦大学;2006年
8 牛进平;3G长期演进系统中调度算法和干扰抑制技术研究[D];西安电子科技大学;2014年
9 罗威;分布式实时容错调度算法研究[D];华中科技大学;2008年
10 展勇;柔性开放车间调度算法研究[D];哈尔滨工程大学;2011年
相关硕士学位论文 前10条
1 丁雪飞;纯电动车整车CAN网络实时调度算法的研究[D];辽宁大学;2015年
2 王德龙;Hadoop平台下作业调度算法的研究与改进[D];南京信息工程大学;2015年
3 袁林伟;载波聚合资源分配及调度算法研究[D];西南交通大学;2015年
4 景木均;3GPP LTE系统中基于多目标决策的下行资源调度算法研究与实现[D];西南交通大学;2015年
5 刘盼红;大数据环境下Hadoop作业调度算法的研究[D];河北工程大学;2015年
6 杨轩;高铁无线通信VoIP业务与多业务共存的资源调度算法[D];西南交通大学;2015年
7 陈传庆;基于衰落信道的无线链路调度算法研究[D];曲阜师范大学;2015年
8 陈文龙;Hadoop平台下作业调度方法研究[D];南京理工大学;2015年
9 陈瑜;针对Hadoop集群的节能调度算法研究[D];电子科技大学;2015年
10 朱新新;网络端到端流量的QoS优化技术研究[D];电子科技大学;2014年
,本文编号:1927122
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1927122.html