面向Hadoop存储系统的节能优化技术研究
本文选题:节能存储 + Hadoop系统 ; 参考:《华中科技大学》2012年硕士论文
【摘要】:近年来,基于云计算的互联网服务不断涌现,其中MapReduce计算范式和HDFS分布式文件系统已逐渐成为开发大型数据密集型应用的首选模型。从硬件供应商的角度,这类应用部署的规模如此巨大,降低服务集群的功率消耗既可以显著降低运营成本,又能降低碳排放量,从而提高整体能效。 在传统服务器节能策略的基础上,针对提供MapReduce作业服务的集群,提出一种节能优化算法。该算法能根据集群当前整体和局部的工作负载动态地重构节点或节点上的数据;同时,控制数据放置策略很好的支持上述操作。该节能优化算法具备了节能效果明显、实时性高以及负载均衡开销小等特性,,可应用于数据密集型计算集群和企业数据中心等环境中。 具体地,实现节能优化的能耗控制系统由数据分发模块、节点失效模块和能耗调节模块三个组件组成。数据分发模块通过对HDFS数据块分发和对应副本放置流程进行修改,实现人为控制数据块号到DataNode节点映射;节点失效模块使得HDFS具备容忍节点增加/缺失的功能;能耗调节器是提高能效的核心,包含两个线程,分别对应两种算法:dilution和enrichment。在集群的某个机架利用率高于管理员预定的阈值时,能耗调节模块会根据dilution算法适时地添加新节点,并将附近节点上的数据迁移到新节点上;当集群出现某个机架的利用率偏低时,能耗调节器可依据enrichment算法移除目标节点,并其上的数据迁移到附近节点上。从而,实现系统当前工作负载与系统性能的动态匹配。 在最终测试方面,利用GridSim Toolkit对节能优化算法从功能和节能效果两个方面进行了测试和评估,前者主要验证了enrichment和dilution算法是否能在集群负载变化时重构节点或者数据;后者着重测试了在平均负载和低负载条件下节能的效果,并与传统Covering Set技术进行了比较。实验结果表明提出的节能优化算法在MapReduce计算中高负载情况下能达到30.32%的节能效果,在低负载情况下能达到69.77%的节能效果。
[Abstract]:In recent years, cloud based Internet services have springing up. The MapReduce computing paradigm and HDFS distributed file systems have gradually become the preferred model for developing large data intensive applications. From the point of view of hardware vendors, the scale of such applications is so large that the power consumption of lower service clusters can be significantly reduced. Operating costs can also reduce carbon emissions, thereby improving overall energy efficiency.
On the basis of the traditional server energy saving strategy, an energy-saving optimization algorithm is proposed for the cluster providing MapReduce job service. This algorithm can dynamically restructure the data on nodes or nodes according to the current overall and local workload of the cluster. At the same time, the control data placement strategy supports the above operation very well. The method has the characteristics of obvious energy saving effect, high real time and low load balance, which can be used in data intensive computing cluster and enterprise data center.
Specifically, the energy control system for energy saving optimization is composed of three components: data distribution module, node failure module and energy consumption regulation module. The data distribution module can control the data block number to the DataNode node by changing the HDFS data block distribution and corresponding replica placement process, and the node failure module makes HDFS The energy regulator is the core of increased energy efficiency; the energy regulator is the core of energy efficiency improvement, including two threads, which correspond to two algorithms respectively: dilution and enrichment. can add new nodes according to the dilution algorithm at a time when the utilization rate of a frame in the cluster is higher than that of the administrator. The data on the point is migrated to the new node. When the utilization rate of a frame is low, the energy regulator can remove the target nodes according to the enrichment algorithm and migrate the data to the nearby nodes. Thus, the current workload of the system can be matched with the dynamic state of the system performance.
In the final test, the GridSim Toolkit is used to test and evaluate the energy saving optimization algorithm from two aspects of function and energy efficiency. The former mainly validates whether the enrichment and dilution algorithms can reconstruct nodes or data when the cluster load changes; the latter focuses on testing the energy saving under the average load and low load conditions. The results are compared with the traditional Covering Set technology. The experimental results show that the proposed energy saving optimization algorithm can achieve 30.32% energy saving effect in the case of high load in the MapReduce calculation, and can achieve 69.77% energy saving effect under low load conditions.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 张询;速度快容量大的新型存储系统[J];世界电子元器件;1997年09期
2 杨春燕;用SAN构筑现代企业信息存储系统的优势[J];内蒙古电力技术;2002年S1期
3 ;专家观点[J];中国计算机用户;2006年43期
4 ;HDS AMS 2000系列的创新之道[J];通信世界;2009年08期
5 金文新;;大型高校图书馆计算机网络集成系统建设[J];情报科学;2009年04期
6 李静;;浅谈HIS系统对服务器和存储设备的要求及设计方案[J];信息与电脑(理论版);2009年11期
7 刘刚;张海涛;李瑞东;张强;;一种基于模块化设计的NAS集群存储系统[J];微计算机信息;2011年05期
8 于耳;;建立面向应用的存储系统[J];中国教育网络;2011年06期
9 ;数字视频存储系统[J];光学精密工程;1977年06期
10 张明明;;为信息传输设备保驾护航——访EMC公司中国区产品经理马永亨先生[J];上海微型计算机;1998年Z1期
相关会议论文 前10条
1 赵志刚;;存储系统在企业信息化中的应用[A];2005年安徽通信论文集[C];2006年
2 朱平;朱建涛;高剑刚;蒋金虎;;高性能计算存储关键技术研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
3 周博;宿绍莹;陈曾平;;基于CPCI总线的宽带雷达数据传输存储系统设计[A];全国第二届信号处理与应用学术会议专刊[C];2008年
4 周功业;周江;陈希;陈进才;;寄生存储原理及实现机制[A];第15届全国信息存储技术学术会议论文集[C];2008年
5 汪黎;章文嵩;杨学军;;Cfslight:一个新型的轻量级对象存储集群文件系统[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
6 聂明;;构建海量存储系统 提升媒体竞争力[A];中国新闻技术工作者联合会2008年学术年会论文集(下)[C];2008年
7 王克敏;张玺;胡江凯;王毅涛;;NWP资料归档方法及其存储系统的应用[A];中国气象学会2006年年会“中尺度天气动力学、数值模拟和预测”分会场论文集[C];2006年
8 刘湛明;吴柳坚;;数字电视台的建设[A];2007第二届全国广播电视技术论文集2(下)[C];2007年
9 黄晓峰;张杰;;矿井信息中心存储系统设计[A];安全高效矿井机电装备及信息化技术——陕西省煤炭学会学术年会论文集(2011)[C];2011年
10 罗香玉;李传佑;汪芸;;纠删码容错组的布局策略研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
相关重要报纸文章 前10条
1 朗飞;IBM“冰立方”就像搭积木[N];中国计算机报;2006年
2 郭涛;MediaGrid既不是SAN也不是NAS[N];中国计算机报;2007年
3 本报记者 张峰;知己知彼建存储(上)[N];网络世界;2006年
4 森林;NAS资源存储系统[N];中国电脑教育报;2002年
5 Hifn(汉帆)杭州信息技术有限公司 马剑杰;自动精简配置:提升存储利用率有绝招[N];中国计算机报;2009年
6 ;IBM收购存储解决方案公司[N];计算机世界;2007年
7 本报记者 徐恒;面临机遇 中国新型存储业合作求创新[N];中国电子报;2011年
8 李想 徐晋;福州电业局研发个人文件安全存储系统[N];中国电力报;2006年
9 ;HDS推出企业入门级存储系统[N];计算机世界;2005年
10 ;戴尔EMC打造新一代高容量存储系统[N];人民邮电;2004年
相关博士学位论文 前10条
1 陆承涛;存储系统性能管理问题的研究[D];华中科技大学;2010年
2 聂雪军;内容感知存储系统中信息信息生命周期管理关键技术研究[D];华中科技大学;2011年
3 罗东健;大规模存储系统高可靠性关键技术研究[D];华中科技大学;2011年
4 聂雪军;内容感知存储系统中信息生命周期管理关键技术研究[D];华中科技大学;2010年
5 王玉林;多节点容错存储系统的数据与缓存组织研究[D];电子科技大学;2010年
6 王鹏;低密度奇偶校验码应用于存储系统的关键技术研究[D];华中科技大学;2013年
7 施展;基于本体的存储系统管理研究[D];华中科技大学;2011年
8 黄继鹏;高速高可靠小型数字视频存储系统的设计与实现[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
9 刘科;内容感知存储系统中的信息检索关键技术研究[D];华中科技大学;2012年
10 姜明华;基于冗余智能存储通道的存储系统关键技术研究[D];华中科技大学;2011年
相关硕士学位论文 前10条
1 陆正武;面向流媒体应用存储系统的研究与实现[D];华中科技大学;2004年
2 杜睿;基于IP-SAN技术的石化企业数据集中存储系统的设计与实现[D];华东理工大学;2010年
3 金强;基于HBase的RDF存储系统的研究与设计[D];浙江大学;2011年
4 余智敏;数字化图书馆的数据存储技术的研究[D];武汉理工大学;2006年
5 陶博舟;磁盘阵列快照系统的设计与实现[D];华中科技大学;2007年
6 张小艳;基于嵌入式技术的USB存储系统的设计与实现[D];内蒙古大学;2011年
7 蒋亚群;基于DLX体系结构的微处理器核的设计与实现[D];中国人民解放军国防科学技术大学;2002年
8 亓伟;关系数据库存储子系统研究与实现[D];清华大学;2005年
9 宋迎迎;数字馆藏评价指标体系研究[D];郑州大学;2006年
10 袁晓铭;磁盘阵列系统的快照技术研究[D];华中科技大学;2007年
本文编号:1869564
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1869564.html