当前位置:主页 > 科技论文 > 计算机论文 >

云计算环境下基于MapReduce模型的任务调度算法研究

发布时间:2018-11-04 09:17
【摘要】:云计算作为一种新的计算模式或者说服务模式,主要通过互联网向用户提供计算、存储、应用平台等各种服务,在国内外各大研究机构及企业的大力推动下,其发展迅速,为处理互联网应用平台日益增长的庞大数据量提供了良好的解决方案。自2004年Google公司提出能并发处理海量数据的MapReduce并行编程模型起,基于MapReduce模型的云平台不断涌现,其中以Hadoop平台应用最为广泛,而基于MapReduce模型的任务调度问题也成为了学者研究的热点问题,高效的任务调度算法能提高云计算系统的整体性能以及更合理地分配和利用云计算中心的资源,,对云计算平台处理海量数据有重要意义。 本文首先介绍了云计算的背景及相关技术,重点对MapReduce编程模型进行描述和分析,详细介绍了MapReduce的执行过程;其次,介绍云计算环境下基于MapReduce编程模型的任务调度的新特征,并详细介绍了几种典型的云平台任务调度算法,其主要包括:FIFO算法、MaxCover-Balance算法、公平算法、延迟调度算法、遗传算法。 在认真分析和研究云计算相关技术以及各算法的优缺点后,提出了两个改进的任务调度算法。首先,针对已有的延迟调度算法存在的问题进行改进,通过分析数据中心计算节点空闲速率、网络传输速率、节点负载等各动态参数,根据概率模型调整每个作业的等待时间阈值以及空闲计算节点的等待时间,优化算法性能;其次,对原有自适应遗传算法进行改进,在保证用户公平性的前提下,将任务调度到输入数据所在的计算节点以减少网络传输开销,并以缩短总任务的完成时间及提高用户满意度为目标,优化算法性能。 最后通过Matlab模拟仿真云计算环境,设置和调整实验参数,对比分析原有算法与改进后的算法。通过反复实验,结果表明改进的延迟调度算法在数据本地性、作业公平性及作业完成时间方面优于已有的延迟调度算法,是云计算环境下有效的任务调度算法;改进的遗传算法在响应时间、公平性和用户满意度方面优于自适应遗传算法,更加适应云计算环境。
[Abstract]:Cloud computing as a new computing model or service model, mainly through the Internet to provide users with computing, storage, application platform and other services, in the domestic and foreign major research institutions and enterprises to promote its rapid development. It provides a good solution to deal with the growing data volume of Internet application platform. Since Google Company put forward the MapReduce parallel programming model which can deal with massive data concurrently in 2004, cloud platforms based on MapReduce model have been emerging, among which Hadoop platform is the most widely used. The task scheduling problem based on MapReduce model has become a hot topic for scholars. Efficient task scheduling algorithm can improve the overall performance of cloud computing system and allocate and utilize the resources of cloud computing center more reasonably. It is important for cloud computing platform to deal with massive data. This paper first introduces the background and related technologies of cloud computing, focuses on the description and analysis of MapReduce programming model, and introduces the execution process of MapReduce in detail. Secondly, it introduces the new characteristics of task scheduling based on MapReduce programming model in cloud computing environment, and introduces several typical cloud platform task scheduling algorithms in detail, including: FIFO algorithm, MaxCover-Balance algorithm, fair algorithm, delay scheduling algorithm. Genetic algorithm. After analyzing and studying cloud computing technologies and the advantages and disadvantages of each algorithm, two improved task scheduling algorithms are proposed. First of all, the existing delay scheduling algorithm is improved, by analyzing the data center to calculate the node idle rate, network transmission rate, node load and other dynamic parameters. According to the probabilistic model, the waiting time threshold of each job and the waiting time of idle computing node are adjusted to optimize the performance of the algorithm. Secondly, the original adaptive genetic algorithm is improved to reduce the network transmission overhead by scheduling the task to the computing node where the input data is located on the premise of ensuring the fairness of the user. In order to shorten the completion time of the total task and improve the user satisfaction, the performance of the algorithm is optimized. Finally, we simulate the cloud computing environment by Matlab, set and adjust the experimental parameters, and compare the original algorithm with the improved algorithm. Through repeated experiments, the results show that the improved delay scheduling algorithm is superior to the existing delay scheduling algorithm in terms of data locality, job fairness and job completion time, and is an effective task scheduling algorithm in cloud computing environment. The improved genetic algorithm is superior to the adaptive genetic algorithm in response time, fairness and user satisfaction, so it is more suitable for cloud computing environment.
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP338.6

【相似文献】

相关期刊论文 前10条

1 马海波;李敬朋;徐志英;;校园网格智能代理的最大响应比任务调度算法[J];大连交通大学学报;2008年04期

2 张利权;杨瑞娟;肖玉芬;;一种基于通信开销的网格任务调度算法[J];空军雷达学院学报;2008年01期

3 李慧贤;程春田;庞辽军;;网格环境下的高效动态任务调度算法[J];华南理工大学学报(自然科学版);2006年01期

4 王树鹏;云晓春;余翔湛;;基于生存性和Makespan的多目标网格任务调度算法研究[J];通信学报;2006年02期

5 李云涛;崔少辉;;一种基于UUTs模型的并行测试任务调度算法[J];电子测量技术;2009年07期

6 周建中;王树宗;石章松;王成飞;;基于遗传算法的网格任务调度方法研究[J];舰船科学技术;2009年11期

7 邓定兰;于炯;谭亚丽;吕良干;;网格工作流的动态贪心调度算法[J];计算机工程;2010年03期

8 童小念;王伟;舒万能;何秉姣;汪红;;网格环境下加权动态效率的任务调度算法[J];武汉理工大学学报;2008年03期

9 肖国强;杨光;;网格环境下一种新的动态任务调度算法[J];微处理机;2008年02期

10 杨长兴;周军成;;一种基于多维QoS约束的网格作业调度算法[J];计算机系统应用;2009年01期

相关会议论文 前10条

1 杜琳;石慧;刘晓平;;一种基于Q学习的任务调度算法的改进研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年

2 郑启龙;王昊;吴晓伟;房明;;HPMR:多核集群上的高性能计算支撑平台[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年

3 李瑞;王朝坤;郑伟;王建民;王伟平;;基于MapReduce框架的近似复制文本检测[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

4 陈平;王柏;徐六通;吴斌;王艳辉;;电信社群网络中介度的网格并行算法及调度算法[A];2006年全国通信软件学术会议论文集[C];2006年

5 赵伟;陈承收;李立军;;基于MapReduce云计算模型的碰撞检测算法[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年

6 孙广中;肖锋;熊曦;;MapReduce模型的调度及容错机制研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年

7 郑启龙;房明;汪胜;王向前;吴晓伟;王昊;;基于MapReduce模型的并行科学计算[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年

8 金松昌;方滨兴;杨树强;贾焰;;基于Hadoop的网络安全日志分析系统的设计与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年

9 陈飞;曹政;王凯;安学军;;高性能计算节点中的同步操作加速引擎设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

10 李虎;邹鹏;贾焰;周斌;;一种基于Map Reduce的分布式文本数据过滤模型研究[A];第26次全国计算机安全学术交流会论文集[C];2011年

相关重要报纸文章 前10条

1 刘琦;MapReduce:亚马逊云服务再添新援[N];中国计算机报;2009年

2 《网络世界》记者 周源;Platform MapReduce:专注企业级用户[N];网络世界;2011年

3 吴秉熹 朱振明;GPGPU技术在石油领域的应用[N];计算机世界;2011年

4 本报记者 鸣秦;宝德HPC走开放之路[N];计算机世界;2005年

5 新疆油田公司勘探开发研究院地球物理研究所 张峰;灵活调度提升HPC价值[N];计算机世界;2009年

6 一言;戴尔HPCC系统为华中师大尖端课题研究提供计算保障[N];科技日报;2006年

7 ;戴尔HPCC系统助力四川大学化工学院[N];中国电子报;2005年

8 风天;IT技术新药研发显身手[N];中华工商时报;2005年

9 ;戴尔HPCC助力华东理工大学[N];中国电脑教育报;2005年

10 朗飞;为集群计算系统选存储[N];中国计算机报;2006年

相关博士学位论文 前10条

1 巴巍;实时系统动态优先级任务调度算法的研究[D];大连理工大学;2010年

2 杨志邦;一类异构多处理器片上系统任务调度算法研究与应用[D];湖南大学;2012年

3 马丹;任务间相互依赖的并行作业调度算法研究[D];华中科技大学;2007年

4 贺小川;单芯片系统(SoC)中的实时任务调度算法研究[D];国防科学技术大学;2009年

5 钟锋;基于网格的煤炭企业信息化关键技术研究[D];中国矿业大学(北京);2009年

6 郑霄;超级计算机系统的可用性评估研究[D];解放军信息工程大学;2009年

7 陈锦言;P2P环境下的信誉评价[D];天津大学;2008年

8 马辉;基于MapReduce的分布式地震射线追踪方法研究[D];中国地质大学(北京);2012年

9 史恒亮;云计算任务调度研究[D];南京理工大学;2012年

10 刘姗姗;基于P2P的大规模分布式虚拟现实系统设计中若干问题的研究[D];中国科学技术大学;2008年

相关硕士学位论文 前10条

1 邹伟明;云计算环境下基于MapReduce模型的任务调度算法研究[D];新疆大学;2013年

2 李坤;云环境下的任务调度算法研究与实现[D];吉林大学;2012年

3 张希翔;云计算环境下任务调度算法的研究[D];广西大学;2012年

4 朱雪庆;基于反馈机制的实时弹性任务调度算法研究[D];湖南大学;2011年

5 高鸣;云计算环境下基于时间富余度的任务调度算法研究与实现[D];云南大学;2011年

6 范国昌;网格计算的Online-Min-Min任务调度算法研究[D];北京邮电大学;2010年

7 王瑞军;网格计算中任务调度算法的分析和研究[D];北京化工大学;2011年

8 钟英姿;QoS约束下的网格任务调度算法研究[D];中南大学;2010年

9 曹晓磊;基于LRSS的可重构任务调度算法研究[D];解放军信息工程大学;2010年

10 王强;数据放置与任务调度算法的研究[D];吉林大学;2013年



本文编号:2309397

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2309397.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c86a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com