基于心跳超时机制的Hadoop实时容错技术
本文选题:云计算 + 心跳机制 ; 参考:《计算机应用》2015年10期
【摘要】:针对官方的Hadoop软件中提供的节点心跳超时容错机制对短作业并不合理,而且忽略了异构集群中各节点超期时间设置的公平性的问题,提出了公平心跳超时容错机制。首先根据每个节点的可靠性及计算性能构建节点故障误判损失模型,提出公平误判损失(FMJL)算法,使其同时满足长作业和短作业要求;接着,设计并实现了基于FMJL算法的公平超时机制。在实现了公平超时机制的Hadoop上运行大约345 s的短作业时,当出现Task Tracker节点故障时作业完成时间平均大约节省了44%,与自适应超时机制相比,作业完成时间大约节省了23%。实验结果表明,公平超时机制在保证不影响长作业完成时间的情况下缩短了短作业的容错处理时间,提高了Hadoop的实时处理效率。
[Abstract]:The node heartbeat fault tolerance mechanism provided in the official Hadoop software is not reasonable for short operation, and ignores the fairness of each node in the heterogeneous cluster, and puts forward a fair heartbeat timeout fault-tolerant mechanism. First, the node fault misjudgement loss model is constructed according to the reliability and computing performance of each node. A fair misjudgement loss (FMJL) algorithm is proposed to meet both long and short job requirements; then, a fair timeout mechanism based on FMJL algorithm is designed and implemented. When a short operation of about 345 s is run on a fair timeout mechanism, the job completion time is roughly reduced when a Task Tracker node fails. 44%, compared with the adaptive timeout mechanism, the job completion time saves about 23%. experimental results, which shows that the fair timeout mechanism reduces the fault-tolerant processing time of short jobs and improves the real-time processing efficiency of Hadoop without affecting the long job completion time.
【作者单位】: 西南交通大学信息科学与技术学院;计算机软件新技术国家重点实验室(南京大学);
【基金】:国家自然科学基金资助项目(61202043,61170111) 网络智能信息处理四川省高校重点实验室开放课题资助项目(SZJJ2014-049)
【分类号】:TP302.8
【参考文献】
相关期刊论文 前4条
1 陈晗鸣;罗威;李明辉;;分布式系统中基于主/副版本的实时容错调度综述[J];计算机应用研究;2012年11期
2 邓鹏;李枚毅;何诚;;Namenode单点故障解决方案研究[J];计算机工程;2012年21期
3 廖福蓉;王成良;陈蜀宇;;基于任务备份的云计算容错调度算法[J];计算机工程;2012年24期
4 张治斌;李燕歌;;云计算下MapReduce多组容错机制架构的分析与研究[J];微电子学与计算机;2014年01期
【共引文献】
相关期刊论文 前10条
1 郎波;张博宇;;面向大数据的非结构化数据管理平台关键技术[J];信息技术与标准化;2013年10期
2 邵景峰;崔尊民;王进富;白晓波;;大数据下纺织制造执行系统的构建[J];纺织器材;2013年06期
3 张亚楠;谭跃生;;基于MapReduce的并行遮盖文本聚类算法[J];内蒙古科技大学学报;2013年03期
4 周国亮;朱永利;王桂兰;;CC-MRSJ:Hadoop平台下缓存敏感的星型联接算法[J];电信科学;2013年10期
5 王鹏;黄焱;刘峰;安俊秀;;大数据技术中计算与数据的协作机制[J];成都信息工程学院学报;2014年01期
6 杜政颉;王鹏;黄焱;郎福通;;一种基于Storm编程模型的迭代Topology方案[J];成都信息工程学院学报;2014年01期
7 范飞;黄文明;邓珍荣;;Oozie工作流在Mahout分布式数据挖掘中的应用[J];桂林电子科技大学学报;2014年01期
8 丁玉成;诸葛晴凤;沙行勉;;云计算环境下排序算法的性能分析[J];重庆大学学报;2014年04期
9 乔媛媛;刘芳;凌艳;尹劲松;;云计算环境下MapReduce的资源建模与性能预测[J];北京邮电大学学报;2014年S1期
10 刘琼;赵荣;孙立坚;;Map/Reduce框架下的粗糙集空间数据挖掘改进算法[J];测绘科学;2014年05期
相关博士学位论文 前10条
1 李健;云计算环境下最小化运营开销的调度技术研究[D];北京邮电大学;2013年
2 韩晶;大数据服务若干关键技术研究[D];北京邮电大学;2013年
3 程祥;高效可靠的虚拟网络映射技术研究[D];北京邮电大学;2013年
4 李韧;基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究[D];重庆大学;2013年
5 卢风顺;面向CPU/GPU异构体系结构的并行计算关键技术研究[D];国防科学技术大学;2012年
6 孙鹏;动车组维修物联网及其关键技术研究[D];中国铁道科学研究院;2013年
7 肖奎;维基百科大数据的知识挖掘与管理方法研究[D];武汉大学;2013年
8 程兴国;仿生算法的动态反馈机制及其并行化实现方法研究[D];华南理工大学;2013年
9 马冯;数据密集型计算环境下贝叶斯网的学习、推理及应用[D];云南大学;2013年
10 韩海雯;MapReduce计算任务调度的资源配置优化研究[D];华南理工大学;2013年
【二级参考文献】
相关期刊论文 前10条
1 王晋川;何宏;张福临;;MapReduce框架与调度容错机制研究[J];中国储运;2010年12期
2 蔡兴旺;段梦博;;云计算及其在数据挖掘上的应用研究[J];电脑知识与技术;2010年22期
3 韩宗芬,秦啸,庞丽萍,李胜利;分布式系统的实时容错任务调度算法设计[J];华中理工大学学报;1999年04期
4 张拥军,张怡,彭宇行,陈福接;一种基于多处理机的容错实时任务调度算法[J];计算机研究与发展;2000年04期
5 罗威;阳富民;庞丽萍;李俊;;基于延迟主动副版本的分布式实时容错调度算法[J];计算机研究与发展;2007年03期
6 阳春华,计莉,沈德耀,桂卫华;实时多处理机系统BEST-FIT启发式容错调度[J];计算机工程与科学;2003年05期
7 秦啸,韩宗芬,庞丽萍;基于异构分布式系统的实时容错调度算法[J];计算机学报;2002年01期
8 郭辉,王智广,周敬利;异构分布式系统中基于负载均衡的容错调度算法[J];计算机学报;2005年11期
9 李建锋;彭舰;;云计算环境下基于改进遗传算法的任务调度算法[J];计算机应用;2011年01期
10 范杰;彭舰;黎红友;;基于蚁群算法的云计算需求弹性算法[J];计算机应用;2011年S1期
【相似文献】
相关期刊论文 前6条
1 黄迎;我永远是你的最新联系人[J];电脑爱好者;2004年18期
2 软语轻柔;;我的程序你删不掉[J];电脑迷;2008年10期
3 ;诺基亚3100C手机时间设置小诀窍[J];电脑爱好者;2008年09期
4 彭登联;;Flash课件中有关时间设置的三种类型[J];中小学电教;2007年10期
5 realrocking;;让你的字幕同步[J];电脑迷;2003年07期
6 ;[J];;年期
相关重要报纸文章 前2条
1 广东 沈苏民;电子电炖煲检修三例[N];电子报;2010年
2 江西 吴建国;格力KF-25GW型分体空调控制电路检修一例[N];电子报;2004年
,本文编号:1804352
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1804352.html