MDDS:一种面向高性能计算的并行文件系统元数据性能提升方法
本文关键词: 高性能计算 并行文件系统 元数据代理 I/O转发 负载均衡 出处:《计算机研究与发展》2014年08期 论文类型:期刊论文
【摘要】:随着计算能力的增强、应用课题规模和复杂度的增加,高性能计算机对并行文件系统性能要求越来越高.在海量小文件和大规模并发I/O操作的应用场景中,文件系统元数据的吞吐率成为限制其性能的关键因素.设计并实现了元数据代理(meta data delegation service,MDDS),通过降低元数据服务间的耦合度,保证元数据集群的高可用性;使用目录子树方式管理元数据代理空间,避免跨节点目录引入的分布式原子操作的复杂性和低效性.并针对高性能计算中I/O转发架构,提出基于元数据代理的两种作业调度策略——单作业独占单元数据代理调度和多作业共享多元数据代理调度——实现作业间和作业内的负载均衡.在116台存储服务器上对MDDS进行评估,实验结果表明,元数据代理提供了拟线性的元数据性能,在大规模的环境中较Lustre CMD方案有较好的扩展性;两种调度方式有效分散了作业元数据的负载,改善了高性能计算中的元数据瓶颈问题.
[Abstract]:With the enhancement of computing power and the increase of application scale and complexity, the performance of parallel file system is becoming more and more demanding by high-performance computers, in the application scenarios of large numbers of small files and large-scale concurrent I / O operations. File system metadata throughput has become a key factor limiting its performance. A metadata agent, meta data delegation service, is designed and implemented. MDDS can ensure the high availability of metadata cluster by reducing the coupling degree between metadata services. The metadata agent space is managed by directory subtree to avoid the complexity and inefficiency of the distributed atomic operation introduced by cross-node directories and the I / O forwarding architecture in high-performance computing. This paper proposes two job scheduling strategies based on metadata agent- single job exclusive unit data agent scheduling and multi job sharing multiple data agent scheduling to achieve load balancing between jobs and within jobs. The MDDS is evaluated on the storage server. The experimental results show that the metadata agent provides quasilinear metadata performance and is more scalable than the Lustre CMD scheme in large-scale environments. The two scheduling methods effectively disperse the workload of the job metadata and improve the bottleneck problem of metadata in high performance computing.
【作者单位】: 江南计算技术研究所;
【基金】:国家“八六三”高技术研究发展计划基金项目(2011BAH04B03,2013AA013203)
【分类号】:TP38
【正文快照】: 高性能计算系统被广泛应用在科学研究、工业生产、国防军事等各种领域,在能源、航天、气象、生命科学、金融、动漫等各个行业发挥着重大作用,其按功能可分为存储子系统和计算子系统两部分.存储子系统为整机提供全局一致的共享存储空间,计算子系统以全局存储空间为纽带相互协作
【相似文献】
相关期刊论文 前10条
1 虞海江;马建刚;叶丹;李建峰;;基于发布订阅模式的数据集成中间件系统设计实现[J];计算机系统应用;2007年11期
2 周亚;;2001—2008年国内元数据自动抽取研究综述[J];科技情报开发与经济;2009年23期
3 金均强,王艳东,龚健雅;基于元数据的空间数据管理分发系统的设计与实现[J];测绘信息与工程;2005年05期
4 樊小泊;陈红;;海量影像数据库管理系统关键技术研究[J];计算机工程与应用;2006年30期
5 孙素云;;基于元数据集成检索系统的设计与实现[J];广东轻工职业技术学院学报;2007年02期
6 高敏;黄树桃;王树红;钟霞;;高放废物地质处置元数据设计与编辑模块开发[J];世界核地质科学;2010年03期
7 高峰;赵芳;;元数据技术在MDSS实时气象数据库系统建设中的应用[J];气象科技;2006年S1期
8 王良清;;关于建设省级地理空间数据交换中心的思考[J];现代测绘;2006年06期
9 叶国权;宁洪;;元仓库与源数据库的元数据同步策略的研究与设计[J];现代电子技术;2010年17期
10 王会娜,聂时贵,刘玫;地理数据库元数据标准框架的研究[J];现代测绘;2005年S1期
相关会议论文 前10条
1 赵培翔;张铭;杨冬青;唐世渭;;数字化文档元数据的自动提取[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
2 沈卫超;陈虹;夏芳;宋磊;;元数据管理系统的设计与实现[A];第15届全国信息存储技术学术会议论文集[C];2008年
3 陈胜鹏;邱文;;基于元数据的空间地理信息管理系统整合的研究与实现[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
4 高峰;;实时气象资料数据库分系统[A];信息技术在气象领域的开发应用论文集(二)[C];2006年
5 王会娜;聂时贵;刘玫;;地理数据库元数据标准框架的研究[A];'2005数字江苏论坛——电子政务与地理信息技术论文专辑[C];2005年
6 王会娜;聂时贵;刘玫;;地理数据库元数据标准框架的研究[A];'2005数字江苏论坛电子政务与地理信息技术论文专辑[C];2005年
7 寿志勤;崇大志;;四库建设中的元数据标准的确定与存储实现[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
8 高丽娟;刘燕军;陈志成;;构件互操作描述语言的定义与实现[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
9 潘定;潘云姗;;DW 2.0环境中的元数据版本管理[A];第二十九届中国控制会议论文集[C];2010年
10 徐平均;王弘X;肖丽;廖丽;夏芳;;并行分布可视化系统JaVis中的I/O优化机制[A];第15届全国信息存储技术学术会议论文集[C];2008年
相关重要报纸文章 前10条
1 赵旭;元数据管理的五种成熟度[N];计算机世界;2006年
2 毕建涛 曹彦荣 何建邦 池天河;共享海量遥感影像数据[N];计算机世界;2006年
3 中国传媒大学计算机学院 朱立谷邋柳昊 孙志伟 郅斌;非结构化数据的归档术[N];中国计算机报;2007年
4 张峰;存储信息 迅速搜索[N];网络世界;2007年
5 浪潮存储产品部研发工程师 宫兴斌;基于PVFS的并行文件系统[N];网络世界;2005年
6 中国科学院计算技术研究所 常亮邋史忠植;语义Web的逻辑基础[N];计算机世界;2007年
7 吴彬松;安徽省电子文件中心系统接收与长久保存电子文件的策略[N];中国档案报;2007年
8 谢海燕;Vista 的WSD机制[N];计算机世界;2007年
9 陈凯锋;Linux服务器维护要点[N];中国电脑教育报;2002年
10 潘柏君;湖南省第三测绘院科学发展成绩喜人[N];中国测绘报;2011年
相关博士学位论文 前10条
1 万继光;集群多媒体存储系统的数据组织研究[D];华中科技大学;2007年
2 南凯;面向关系型数据共享的数据网格中间件研究[D];中国科学院研究生院(计算技术研究所);2006年
3 王晓蕊;华北克拉通地球化学科学数据的管理及应用研究[D];中国地质大学;2008年
4 柴胜;空间资源中信息语义注册与检索相关技术研究[D];吉林大学;2008年
5 符青云;面向大规模流媒体服务的高性能存储系统研究[D];电子科技大学;2009年
6 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年
7 韦亚星;基于数据网格的地理空间信息协作共享系统研究[D];中国科学技术大学;2007年
8 袁庆霓;基于网络化制造环境的制造资源共享服务语义关键技术研究[D];西南交通大学;2010年
9 吴砥;学习资源管理与服务关键技术研究[D];华中科技大学;2006年
10 左琼;基于MPEG-7的通用多媒体数据库模型研究[D];华中科技大学;2010年
相关硕士学位论文 前10条
1 延娅妮;基于RDF语义元数据的构件动态组装系统[D];北京邮电大学;2008年
2 任广治;基于元数据的气象信息共享平台的设计与实现[D];山东大学;2008年
3 李方伟;基于元数据的教育资源非结构化数据组织管理[D];内蒙古大学;2008年
4 张晓凤;复杂产品项目中管理要素元数据的提取与管理研究[D];江苏科技大学;2013年
5 郭健;科技期刊开放存取的研究与实现[D];吉林大学;2007年
6 李武;面向现代服务业的大规模分布式文件存储系统设计和实现[D];浙江大学;2008年
7 刘高岭;海洋信息元数据目录服务系统的设计与实现[D];中国海洋大学;2008年
8 卢佳;基于元数据的构件软件回归测试技术[D];大连海事大学;2009年
9 韩雨;基于构件软件集成测试的研究和应用[D];西安建筑科技大学;2009年
10 连晓佳;基于元数据的油田信息可视化模型研究与设计[D];电子科技大学;2009年
,本文编号:1448632
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1448632.html