云计算环境下基于MapReduce模型的任务调度算法研究
[Abstract]:Cloud computing as a new computing model or service model, mainly through the Internet to provide users with computing, storage, application platform and other services, in the domestic and foreign major research institutions and enterprises to promote its rapid development. It provides a good solution to deal with the growing data volume of Internet application platform. Since Google Company put forward the MapReduce parallel programming model which can deal with massive data concurrently in 2004, cloud platforms based on MapReduce model have been emerging, among which Hadoop platform is the most widely used. The task scheduling problem based on MapReduce model has become a hot topic for scholars. Efficient task scheduling algorithm can improve the overall performance of cloud computing system and allocate and utilize the resources of cloud computing center more reasonably. It is important for cloud computing platform to deal with massive data. This paper first introduces the background and related technologies of cloud computing, focuses on the description and analysis of MapReduce programming model, and introduces the execution process of MapReduce in detail. Secondly, it introduces the new characteristics of task scheduling based on MapReduce programming model in cloud computing environment, and introduces several typical cloud platform task scheduling algorithms in detail, including: FIFO algorithm, MaxCover-Balance algorithm, fair algorithm, delay scheduling algorithm. Genetic algorithm. After analyzing and studying cloud computing technologies and the advantages and disadvantages of each algorithm, two improved task scheduling algorithms are proposed. First of all, the existing delay scheduling algorithm is improved, by analyzing the data center to calculate the node idle rate, network transmission rate, node load and other dynamic parameters. According to the probabilistic model, the waiting time threshold of each job and the waiting time of idle computing node are adjusted to optimize the performance of the algorithm. Secondly, the original adaptive genetic algorithm is improved to reduce the network transmission overhead by scheduling the task to the computing node where the input data is located on the premise of ensuring the fairness of the user. In order to shorten the completion time of the total task and improve the user satisfaction, the performance of the algorithm is optimized. Finally, we simulate the cloud computing environment by Matlab, set and adjust the experimental parameters, and compare the original algorithm with the improved algorithm. Through repeated experiments, the results show that the improved delay scheduling algorithm is superior to the existing delay scheduling algorithm in terms of data locality, job fairness and job completion time, and is an effective task scheduling algorithm in cloud computing environment. The improved genetic algorithm is superior to the adaptive genetic algorithm in response time, fairness and user satisfaction, so it is more suitable for cloud computing environment.
【学位授予单位】:新疆大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP338.6
【相似文献】
相关期刊论文 前10条
1 马海波;李敬朋;徐志英;;校园网格智能代理的最大响应比任务调度算法[J];大连交通大学学报;2008年04期
2 张利权;杨瑞娟;肖玉芬;;一种基于通信开销的网格任务调度算法[J];空军雷达学院学报;2008年01期
3 李慧贤;程春田;庞辽军;;网格环境下的高效动态任务调度算法[J];华南理工大学学报(自然科学版);2006年01期
4 王树鹏;云晓春;余翔湛;;基于生存性和Makespan的多目标网格任务调度算法研究[J];通信学报;2006年02期
5 李云涛;崔少辉;;一种基于UUTs模型的并行测试任务调度算法[J];电子测量技术;2009年07期
6 周建中;王树宗;石章松;王成飞;;基于遗传算法的网格任务调度方法研究[J];舰船科学技术;2009年11期
7 邓定兰;于炯;谭亚丽;吕良干;;网格工作流的动态贪心调度算法[J];计算机工程;2010年03期
8 童小念;王伟;舒万能;何秉姣;汪红;;网格环境下加权动态效率的任务调度算法[J];武汉理工大学学报;2008年03期
9 肖国强;杨光;;网格环境下一种新的动态任务调度算法[J];微处理机;2008年02期
10 杨长兴;周军成;;一种基于多维QoS约束的网格作业调度算法[J];计算机系统应用;2009年01期
相关会议论文 前10条
1 杜琳;石慧;刘晓平;;一种基于Q学习的任务调度算法的改进研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 郑启龙;王昊;吴晓伟;房明;;HPMR:多核集群上的高性能计算支撑平台[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
3 李瑞;王朝坤;郑伟;王建民;王伟平;;基于MapReduce框架的近似复制文本检测[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
4 陈平;王柏;徐六通;吴斌;王艳辉;;电信社群网络中介度的网格并行算法及调度算法[A];2006年全国通信软件学术会议论文集[C];2006年
5 赵伟;陈承收;李立军;;基于MapReduce云计算模型的碰撞检测算法[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
6 孙广中;肖锋;熊曦;;MapReduce模型的调度及容错机制研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
7 郑启龙;房明;汪胜;王向前;吴晓伟;王昊;;基于MapReduce模型的并行科学计算[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
8 金松昌;方滨兴;杨树强;贾焰;;基于Hadoop的网络安全日志分析系统的设计与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
9 陈飞;曹政;王凯;安学军;;高性能计算节点中的同步操作加速引擎设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
10 李虎;邹鹏;贾焰;周斌;;一种基于Map Reduce的分布式文本数据过滤模型研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
相关重要报纸文章 前10条
1 刘琦;MapReduce:亚马逊云服务再添新援[N];中国计算机报;2009年
2 《网络世界》记者 周源;Platform MapReduce:专注企业级用户[N];网络世界;2011年
3 吴秉熹 朱振明;GPGPU技术在石油领域的应用[N];计算机世界;2011年
4 本报记者 鸣秦;宝德HPC走开放之路[N];计算机世界;2005年
5 新疆油田公司勘探开发研究院地球物理研究所 张峰;灵活调度提升HPC价值[N];计算机世界;2009年
6 一言;戴尔HPCC系统为华中师大尖端课题研究提供计算保障[N];科技日报;2006年
7 ;戴尔HPCC系统助力四川大学化工学院[N];中国电子报;2005年
8 风天;IT技术新药研发显身手[N];中华工商时报;2005年
9 ;戴尔HPCC助力华东理工大学[N];中国电脑教育报;2005年
10 朗飞;为集群计算系统选存储[N];中国计算机报;2006年
相关博士学位论文 前10条
1 巴巍;实时系统动态优先级任务调度算法的研究[D];大连理工大学;2010年
2 杨志邦;一类异构多处理器片上系统任务调度算法研究与应用[D];湖南大学;2012年
3 马丹;任务间相互依赖的并行作业调度算法研究[D];华中科技大学;2007年
4 贺小川;单芯片系统(SoC)中的实时任务调度算法研究[D];国防科学技术大学;2009年
5 钟锋;基于网格的煤炭企业信息化关键技术研究[D];中国矿业大学(北京);2009年
6 郑霄;超级计算机系统的可用性评估研究[D];解放军信息工程大学;2009年
7 陈锦言;P2P环境下的信誉评价[D];天津大学;2008年
8 马辉;基于MapReduce的分布式地震射线追踪方法研究[D];中国地质大学(北京);2012年
9 史恒亮;云计算任务调度研究[D];南京理工大学;2012年
10 刘姗姗;基于P2P的大规模分布式虚拟现实系统设计中若干问题的研究[D];中国科学技术大学;2008年
相关硕士学位论文 前10条
1 邹伟明;云计算环境下基于MapReduce模型的任务调度算法研究[D];新疆大学;2013年
2 李坤;云环境下的任务调度算法研究与实现[D];吉林大学;2012年
3 张希翔;云计算环境下任务调度算法的研究[D];广西大学;2012年
4 朱雪庆;基于反馈机制的实时弹性任务调度算法研究[D];湖南大学;2011年
5 高鸣;云计算环境下基于时间富余度的任务调度算法研究与实现[D];云南大学;2011年
6 范国昌;网格计算的Online-Min-Min任务调度算法研究[D];北京邮电大学;2010年
7 王瑞军;网格计算中任务调度算法的分析和研究[D];北京化工大学;2011年
8 钟英姿;QoS约束下的网格任务调度算法研究[D];中南大学;2010年
9 曹晓磊;基于LRSS的可重构任务调度算法研究[D];解放军信息工程大学;2010年
10 王强;数据放置与任务调度算法的研究[D];吉林大学;2013年
本文编号:2309397
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2309397.html