存储系统中多维元数据索引的高效更新方法研究
发布时间:2020-05-13 08:25
【摘要】:随着信息量的增长,大规模存储系统的存储容量从以前的TB(Terabyte)级上升到PB(Petabyte)级甚至EB(Exabyte)级,使得查找和处理文件变得越来越困难。现有的基于层次目录树结构的数据存储系统的扩展性和功能性不能有效地满足大规模文件系统中快速增长的数据量和复杂元数据查询的需求。 有效地对存储系统元数据进行组织,比如建立各种索引结构,可以提供各种复杂的查询服务,帮助用户更好地使用文件系统。提出了使用结合R树和布隆过滤器索引来支持多维元数据的索引功能的结构,以支持多种复杂的元数据查询,如点查询、范围查询、K最邻近查询和模糊查询等。由于现有的关于R树的研究主要考虑静态数据,只关注高效的查询处理,R树本身的更新性能较低,特别是应用在海量文件元数据频繁更新的环境下,直接对索引的修改会产生大量的磁盘操作并可能引起索引结构的不平衡。研究的主要内容是结合多版本(versioning)的思想,提出一个基于R树索引结构的更新策略,将一批更新数据看作一个新增的版本。减少更新操作的次数,解决热点数据反复更新问题;同时批量操作数据的更新;使用多个版本结构,利用数据的局部特性优化更新算法。 通过与已有的更新算法进行比较和分析,更新策略采用缓存更新数据的方法,可以有效地提高更新效率,减少更新操作的时间代价;同时点查询效率也有所提高,而范围查询效率有略微的下降。
【图文】:
图 1.1 Ceph 文件系统架构图以 Ceph 为例介绍了目前流行的存储系统三方架构模式,在该分离,使用专门的元数据服务器管理全局名字空间,实现了。目前元数据服务器一般提供基于文件名和目录的查询,,并
图 2.2 R 树的空间分布图含有 N 个索引记录的 R 树的最大高度为mlog N -1 ,因为每个节 m。节点数最多为2N N+ + + 1m m ,因为每个节点的最大分况下除根节点以外的节点的空间利用率为 m/M。节点的入口数一
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP333
本文编号:2661666
【图文】:
图 1.1 Ceph 文件系统架构图以 Ceph 为例介绍了目前流行的存储系统三方架构模式,在该分离,使用专门的元数据服务器管理全局名字空间,实现了。目前元数据服务器一般提供基于文件名和目录的查询,,并
图 2.2 R 树的空间分布图含有 N 个索引记录的 R 树的最大高度为mlog N -1 ,因为每个节 m。节点数最多为2N N+ + + 1m m ,因为每个节点的最大分况下除根节点以外的节点的空间利用率为 m/M。节点的入口数一
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP333
【参考文献】
相关期刊论文 前7条
1 夏宇;朱欣焰;;高维空间数据索引技术研究[J];测绘科学;2009年01期
2 史文中,郭薇,彭奕彰;一种面向地理信息系统的空间索引方法[J];测绘学报;2001年02期
3 廖巍;熊伟;景宁;陈宏盛;钟志农;;支持频繁更新的移动对象混合索引方法[J];计算机研究与发展;2006年05期
4 潘鹏;卢炎生;;基于栅格的R树更新缓存与批处理机制[J];计算机工程;2008年15期
5 陆锋,周成虎;一种基于Hilbert排列码的GIS空间索引方法[J];计算机辅助设计与图形学学报;2001年05期
6 蔡浴泓;孙蕾;;基于R树的空间数据索引技术的探索[J];计算机应用与软件;2008年12期
7 滕连泽;刘洪斌;武伟;;基于空间数据不同索引方法的比较[J];计算机与现代化;2006年01期
本文编号:2661666
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2661666.html