当前位置:主页 > 科技论文 > 计算机论文 >

海量存储系统中数据分布化及其关键技术的研究

发布时间:2020-03-18 13:18
【摘要】: 信息化的飞速发展推动存储系统在规模、体系结构等方面都出现了新的改变,朝着大规模、复杂化的方向演化。同时系统所服务的I/O负载也呈现出多样性、不平衡性和动态性。而当前海量存储系统往往直接继承传统小规模存储系统结构和运行机制,还很难适应具有动态、并发、多样等特性的大规模I/O负载要求。现有的存储系统物理和逻辑的组织基于静态的结构,该结构很难感知外部负载请求特征和系统的运行状态动态改变,从而无法调整自身的存储组织结构以满足不同I/O负载在时间和空间上的变化,无法有效和自动提高系统的整体存储效率。面对上述问题,设计针对海量存储系统的数据分布进化机制,对存储系统的动态数据存取负载特性进行分析,根据数据的历史访问信息通过热度模型对未来访问趋势加以预测,将不同热度的数据与不同性能等特征级别的存储资源组加以匹配映射,动态对数据进行迁移和重新分布,以达到提升整体存储效率的目的。数据分布进化的过程完全是自动化的,由进化规则进行控制,通过进化规则管理系统进行调度。 阐述了能够根据当前运行环境自动调整存储组织模式的海量存储系统中的数据分布进化技术。该系统能在运行过程中根据I/O负载及自身状态的变化,自动选择最适合当前存取负载特征的数据分布模式,满足多用户环境下负载对于性能和可靠性等方面的要求。 建立了数据存取的热度计算模型,对数据存取负载的数据热点进行量化计算和预测。和一般的热度研究结果仅仅涉及数据集的访问次数和频率不同,改进后的热度还综合考虑到访问请求的时间序列因素,使之能够更加有效的体现负载的历史信息,从而能更准确的反映存取负载未来趋势。分别针对文件和LUN的热度进行了分析和定义,以真实的trace数据对热度计算模型加以测试,深入的分析了热度公式的实际数据表现。测试中发现,数据的热度和访问次数和频率正相关,和访问的时间间隔负相关,实验证明热度公式能够较好的对未来的访问行为进行趋势预测。 设计了根据数据热度进行数据分布进化的数据迁移机制。数据分布进化中,需要动态调整数据的分布,以适应系统工作负载的变化,从而提升整体系统的效率。在一般的设计中,根据RAID级别或RAID组对系统存储资源进行分级,而在进化存储系统中,对系统内所有存储资源按照性能和可靠性等特性进行分级。依据程序访问的局部性原理,针对不同行为特性和需求的热点数据,匹配以相应级别的存储资源,从而有效的利用存储池中的不同存储资源,以显著提高进化存储系统的整体效率。数据迁移策略中还对数据迁移的触发条件和开销进行了定义,并设计了进化存储系统的数据替换策略。在实验部分,通过原型系统验证了分级存储数据迁移对性能提升的效果。 设计了独立的进化规则管理系统,实现海量存储系统的自动化管理。在大规模存储系统中,无论存储系统的物理管理和海量数据的逻辑组织和分布都是极为复杂和动态的,仅仅依赖人工管理是不可行的,因此需要设计基于一系列存储规则的系统来管理和调度系统运行状态。在通常的系统中,规则的所有参数都硬编码在代码中,使得规则的定义、更改和查询非常困难。在规则管理系统中,通过对规则词汇的定义,并引入决策表和决策树的管理,使得系统可以灵活、清晰、快速地定义、查询和变更规则,并且通过规则的引用记录来统计和分析规则的使用情况。 研究工作设计和构造可适应自身运行环境的进化存储系统,对数据分布进化中存取负载特性分析和数据迁移机制,以及进化规则的管理都做出了新的尝试,实验证明具有良好的运行效果。
【图文】:

系统结构图,系统结构,访问环境,性能优化


华中科技大学博士学位论文阵列可以使用不同容量和不同性能等规格的异构磁盘。AutoRAID系统的另一个是动态数据转移,它是系统内的一种管理和性能优化机制,通过不间断监控磁列中的设备运行状态和性能,来判断是应该将数据写入或存放在Cache里面,将数据从Cache中倒入到RAIDI的磁盘阵列,或是将数据从Cache中倒入到RA盘阵列。这种管理和性能优化机制非常适合变化的外部数据访问环境,在不影据可靠性的前提下保证系统的高性能,同时降低了系统的成本。对复杂的外部(如事务处理和大块文件访问)访问环境,这种方法非常有效[0]。

模型图,大规模数据,执行顺序,编程模型


图1.4MapReduee执行顺序MapReduee是一种处理和产生大规模数据集的编程模型,同时也是一种高效的任务调度模型。缺点是它更多的是从编程和数据处理上提供并行计算优化,没有结合系统的物理结构和负载特征对系统进行优化,也没有针对并行存储环境中的数据逻辑组织结构进行数据的动态分布,对整个系统的性能优化方面还有局限性。1.2.7块重组(BORG)技术BORG(B10ck一reORGanization)是一种自我优化的存储系统中基于观察到的FO负载的自动块重组技术[26]。BORG基于Fo负载的3个特征:非统一的访问频率分布,非持久的位置和不连续访问中的局部决定论。为了实现目标,,BORG管理着一8
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP333

【参考文献】

相关期刊论文 前1条

1 王宇德;谢长生;姜国松;陆正武;;一种自适应存储系统的研究与设计[J];小型微型计算机系统;2008年10期



本文编号:2588769

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2588769.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户621bb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com