当前位置:主页 > 科技论文 > 计算机论文 >

HDFS异构集群中的分级存储调度机制

发布时间:2018-09-02 07:42
【摘要】:大部分存储集群构建时可能包含有遗留设备及新购置设备,这些设备在存储性能方面存在较大差异.采用HDFS默认的机架感知存储策略时,可能使访问频率高的数据存储在低性能节点上,而访问频率低的数据存储在高性能节点上,既影响集群响应时间,又降低了资源利用率.针对以上问题,提出一种分级存储调度机制.在HDFS机架感知调度策略基础上,首先根据节点的CPU、内存大小、磁盘大小、磁盘I/O等固有硬件性能将节点划分为高配置节点和低配置节点,其次根据节点的CPU使用率、内存使用率、网络带宽使用率、磁盘使用率等性能的动态因素建立节点的性能评价模型,并建立三个性能级别.根据节点配置情况、性能级别及网络位置等多方面因素进行综合调度.同时在集群运行过程中,会根据数据的访问频率对数据块的分布进行动态调整.实验结果表明,本文提出的分级存储调度机制可以在HDFS异构集群中提高数据的访问效率,优化集群性能.
[Abstract]:Most storage cluster builds may include legacy devices and newly acquired devices, which differ greatly in storage performance. When the HDFS default rack aware storage strategy is adopted, the data with high access frequency may be stored on the low performance node, while the data with low access frequency will be stored on the high performance node, which will not only affect the cluster response time, but also reduce the resource utilization rate. Aiming at the above problems, a hierarchical storage scheduling mechanism is proposed. Based on the HDFS rack aware scheduling strategy, the nodes are divided into high configuration nodes and low configuration nodes according to the CPU, memory size of the node and the inherent hardware performance of disk I / O, and then the CPU utilization rate of the nodes. The dynamic factors of memory utilization, network bandwidth utilization, disk utilization and other performance factors establish the performance evaluation model of nodes and establish three performance levels. According to the node configuration, performance level and network location and other factors for comprehensive scheduling. At the same time, the data block distribution will be dynamically adjusted according to the data access frequency during the running process of the cluster. Experimental results show that the proposed hierarchical storage scheduling mechanism can improve data access efficiency and optimize cluster performance in HDFS heterogeneous clusters.
【作者单位】: 北方工业大学云计算研究中心;大规模流数据集成与分析技术北京市重点实验室;
【基金】:北京市教育委员会科技计划重点项目(KZ201310009009)资助 北京市属高等学校创新团队建设与教师职业发展计划基金项目(IDHT20130502)资助
【分类号】:TP333

【参考文献】

相关期刊论文 前9条

1 张华伟;李志华;;基于多目标优化的云存储副本分布策略的研究[J];计算机科学;2015年04期

2 饶磊;杨凡德;李新明;刘东;;基于热度分析的动态副本创建算法[J];计算机应用;2014年S2期

3 任川;杨冬菊;;基于云存储的二阶段动态优化调度机制[J];计算机与数字工程;2014年09期

4 罗鹏;龚勋;;HDFS数据存放策略的研究与改进[J];计算机工程与设计;2014年04期

5 邵秀丽;王亚光;李云龙;刘一伟;;Hadoop副本放置策略[J];智能系统学报;2013年06期

6 陶永才;张宁宁;石磊;卫琳;;异构环境下云计算数据副本动态管理研究[J];小型微型计算机系统;2013年07期

7 廖彬;于炯;张陶;杨兴耀;;基于分布式文件系统HDFS的节能算法[J];计算机学报;2013年05期

8 徐婧;杨寿保;王淑玲;刘晓茜;;CDRS:云存储中一种代价驱动的自适应副本策略[J];中国科学院研究生院学报;2011年06期

9 陈康;郑纬民;;云计算:系统实例与研究现状[J];软件学报;2009年05期

【共引文献】

相关期刊论文 前10条

1 王欢;李红辉;张骏温;;改进K-means聚类的云任务调度算法[J];计算机与现代化;2017年02期

2 沈凤明;崔骋宇;;私有云环境下的VM使用管理策略[J];科技资讯;2016年35期

3 梁俊荣;;基于Hadoop的图书馆复合大数据存储系统研究[J];现代情报;2017年02期

4 齐来军;周丽娟;任仲山;;医学影像云存储模型的研究与设计[J];计算机应用与软件;2017年02期

5 杨娟;;基于云计算的海量数据挖掘体系研究[J];赤峰学院学报(自然科学版);2017年02期

6 方巍;刘琦;;气象云计算虚拟仿真实验教学研究与探索[J];实验技术与管理;2017年01期

7 国冰磊;于炯;廖彬;杨德先;;基于数据库负载的SQL能耗预测模型[J];计算机科学;2017年01期

8 廖彬;张陶;于炯;国冰磊;刘继;;基于二维划分的杰卡德相似系数批量计算效率优化[J];计算机科学;2017年01期

9 张凯旋;顾春华;万峰;;云环境下基于Agent协商的宿主机容错策略[J];计算机应用与软件;2017年01期

10 杨冬菊;李青;邓崇彬;;HDFS异构集群中的分级存储调度机制[J];小型微型计算机系统;2017年01期

【二级参考文献】

相关期刊论文 前10条

1 王健宗;谌炎俊;谢长生;;面向云存储的I/O资源效用优化调度算法研究[J];计算机研究与发展;2013年08期

2 廖彬;于炯;张陶;杨兴耀;;基于分布式文件系统HDFS的节能算法[J];计算机学报;2013年05期

3 王永洲;茅苏;;HDFS中的一种数据放置策略[J];计算机技术与发展;2013年05期

4 陶永才;石磊;;异构资源环境下的MapReduce性能优化[J];小型微型计算机系统;2013年02期

5 董继光;陈卫卫;吴海佳;田浪军;;基于动态副本技术的云存储负载均衡研究[J];计算机应用研究;2012年09期

6 董继光;陈卫卫;田浪军;吴海佳;;大规模云存储系统副本布局研究[J];计算机应用;2012年03期

7 王意洁;孙伟东;周松;裴晓强;李小勇;;云计算环境下的分布存储关键技术[J];软件学报;2012年04期

8 周敬利;周正达;;改进的云存储系统数据分布策略[J];计算机应用;2012年02期

9 林伟伟;;一种改进的Hadoop数据放置策略[J];华南理工大学学报(自然科学版);2012年01期

10 徐婧;杨寿保;王淑玲;刘晓茜;;CDRS:云存储中一种代价驱动的自适应副本策略[J];中国科学院研究生院学报;2011年06期

【相似文献】

相关期刊论文 前10条

1 王晓川,叶超群,金士尧;一种基于分布式调度机制的集群体系结构[J];计算机工程;2002年08期

2 李亮;郝艳梅;李伟绵;;面向移动协同应用的资源动态调度机制[J];河北省科学院学报;2012年04期

3 苗壮;;浅析云计算架构及调度机制[J];电子测试;2014年04期

4 唐飞岳;叶晖;赵明;;机会网络节点唤醒调度机制研究[J];计算机工程与应用;2011年26期

5 赵震;张龙昌;;云计算中多QoS调度机制研究[J];微型电脑应用;2014年01期

6 李慧;马雷明;纪越峰;;面向分布式业务的可重构光网络资源调度机制研究[J];通信学报;2008年12期

7 陈泽晖;常光辉;卜长清;陈蜀宇;;一种支持实时集群系统的双层调度机制[J];计算机科学;2008年10期

8 何福贵;侯义斌;李辉;;嵌入式操作系统调度机制的研究[J];计算机应用研究;2009年01期

9 曾智慧,刘富强,陶健,李庆;IEEE 802.16 Mesh模式下MAC调度机制的研究[J];计算机工程与应用;2005年23期

10 陈剑;贾杰;闻英友;赵大哲;刘积仁;;基于TDMA方式WMN中一种链路调度机制研究[J];控制与决策;2010年09期

相关会议论文 前1条

1 张晓玲;臧传治;于海斌;梁椺;;SDS调度机制系统容量分析[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年

相关重要报纸文章 前5条

1 芦燕娟;我省将制定供热应急预案[N];济南日报;2004年

2 记者 朱娟娟;创新调度机制 提升工作实效[N];泉州晚报;2013年

3 杨茜;加强反恐处突长效机制建设[N];泸州日报;2008年

4 见习记者 武耀琳;我市经济项目库建设力度大[N];朔州日报;2005年

5 杨烈斌;优化网络架构 提升城域核心 传送网络承载效率[N];人民邮电;2012年

相关博士学位论文 前3条

1 黄昭文;无线MESH网络资源调度算法与QoS保障机制研究[D];华南理工大学;2010年

2 李亚军;无线城域网格网(WiMAX Mesh)QoS联合优化关键技术研究[D];上海交通大学;2010年

3 吴润泽;光子网格中智能节点关键技术的研究[D];北京邮电大学;2007年

相关硕士学位论文 前10条

1 冯彦坤;移动容迟网络节点睡眠调度机制研究[D];内蒙古大学;2015年

2 张天纲;PaaS环境中动态资源调度机制的研究与分析[D];北京邮电大学;2015年

3 李琰;可重构WEB服务平台资源调度机制研究[D];国防科学技术大学;2013年

4 谢亚蓉;密集小区干扰管理技术研究[D];西安电子科技大学;2014年

5 杨盛;网络拥塞下VoLTE的调度机制优化[D];东南大学;2015年

6 晏伟;LTE-A载波聚合下的资源分配算法及其切换性能分析[D];北京交通大学;2016年

7 杨恒胜;操作系统调度机制的研究[D];北京交通大学;2012年

8 邢娟;基于Quorum的WSN自适应调度机制研究[D];河南理工大学;2015年

9 闻晨鹭;车辆自组织网络路侧单元高能效调度机制研究[D];东南大学;2016年

10 姜逸坤;HINOC 2.0 MAC层信道调度机制研究[D];西安电子科技大学;2015年



本文编号:2218710

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2218710.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ec867***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com