基于智能预警和自修复的高可靠磁盘阵列关键技术研究
发布时间:2021-11-25 07:11
随着高性能计算和数据中心存储规模的飞速增长,以磁盘为基础的存储系统可靠性已成为影响整个计算机系统可靠性和可用性的关键因素之一。而现有提高存储可靠性的方法,还存在对故障磁盘的容错能力不高、系统修复过程中对用户服务质量降低、修复成本高等缺陷,难以充分满足实际应用的需要。本文以磁盘阵列存储系统可靠性作为研究内容,提出基于智能预警和自修复的高可靠磁盘阵列存储系统,大幅降低了数据丢失的风险,提高了磁盘阵列存储系统的可靠性和可用性。本文的研究工作主要包括以下几个方面:(1)研究提高存储可靠性的主要方法。在对磁盘运行原理进行深入分析的基础上,对磁盘阵列存储系统可靠性的相关内容和相关技术进行了详细的分析,确定了以故障预测为主的提高磁盘阵列存储系统可靠性的技术方案。(2)采集磁盘阵列运行环境下各个磁盘的S.M.A.R.T信息,采用样本均值、趋势分析和信息增益三种属性评估方法,得到了与磁盘运行状态发展趋势密切相关的属性集。(3)研究了机器学习领域分类算法的原理和应用,分析和实现了朴素贝叶斯分类器和支持向量机分类器,提出用决策树算法和提升算法相结合的策略构建分类器(DTB分类器),应用于磁盘故障预测,经过性...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
MTTF、MTTR和MTBF的关系示意图
3.3 SMART 信息属性选择方法节的分析可知,使用 SMART 信息的单一属性或是几个属性预测磁盘故障。因此,我们引入智能预警的策略,以 SMA集,采用机器学习分类算法,对磁盘的运行状态进行分类,生故障。在 SMART 属性中,一些属性与驱动器是否发生性,因此,包含这些属性对于提高分类器的准确性没有太大产生负面影响。同时,使用所有属性的分类器需要消耗较多下,因此,对属性进行合理选择,选出与磁盘状态变化有强要意义。T 信息经属性选择后将作为分类器的输入,对分类器的效果好的属性不一定能够使分类器分类准确、有效,此时分类器类算法;而选择含噪声或是相关性差的属性却一定会导致分从而影响整个系统的有效性。系统各个模块的输入输出关系
第 28 页图 3.2 不同磁盘的同一属性在时间序列上的对比图基于趋势分析属性选择方法的主要思想是:基于样本均值的属性选择仅两类样本 SMART 值的不同。为了预测磁盘驱动器的状态渐变,还应该映磁盘趋势变化的属性。将数据集按照属性分类,再按照磁盘号分类,个磁盘的各个属性值的时间序列。通过在样本中随机抽样,将各属性随的序列值在两类磁盘之间进行对比,将差异明显、能够反映磁盘状态渐选出。图 3.2 所示为随机抽取驱动器属性在时间序列上的对比示例。表 3属性最终选择结果。表 3.8 基于趋势分析方法选择属性结果表属性FlyHeight6 FlyHeight7 FlyHeight8 FlyHeight9 FlyHeight10FlyHeight11 FlyHeight12 FlyHeight13 Servo2 Servo6PList ReadError18 Writes Servo10
【参考文献】:
期刊论文
[1]基于框图法的网络存储系统可靠性分析[J]. 张英,张益,王冀鲁. 计算机科学. 2010(06)
[2]一种基于S.M.A.R.T的保障RAID数据高可靠性的方法[J]. 刘景宁,饶国林,冯丹. 计算机工程与科学. 2007(05)
博士论文
[1]面向高性能计算的可扩展I/O体系结构研究与实现[D]. 李琼.国防科学技术大学 2009
[2]分布式安全存储系统纠删码技术的研究[D]. 万武南.中国科学院研究生院(成都计算机应用研究所) 2006
硕士论文
[1]高性能磁盘阵列自修复技术研究[D]. 张超.国防科学技术大学 2008
本文编号:3517649
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
MTTF、MTTR和MTBF的关系示意图
3.3 SMART 信息属性选择方法节的分析可知,使用 SMART 信息的单一属性或是几个属性预测磁盘故障。因此,我们引入智能预警的策略,以 SMA集,采用机器学习分类算法,对磁盘的运行状态进行分类,生故障。在 SMART 属性中,一些属性与驱动器是否发生性,因此,包含这些属性对于提高分类器的准确性没有太大产生负面影响。同时,使用所有属性的分类器需要消耗较多下,因此,对属性进行合理选择,选出与磁盘状态变化有强要意义。T 信息经属性选择后将作为分类器的输入,对分类器的效果好的属性不一定能够使分类器分类准确、有效,此时分类器类算法;而选择含噪声或是相关性差的属性却一定会导致分从而影响整个系统的有效性。系统各个模块的输入输出关系
第 28 页图 3.2 不同磁盘的同一属性在时间序列上的对比图基于趋势分析属性选择方法的主要思想是:基于样本均值的属性选择仅两类样本 SMART 值的不同。为了预测磁盘驱动器的状态渐变,还应该映磁盘趋势变化的属性。将数据集按照属性分类,再按照磁盘号分类,个磁盘的各个属性值的时间序列。通过在样本中随机抽样,将各属性随的序列值在两类磁盘之间进行对比,将差异明显、能够反映磁盘状态渐选出。图 3.2 所示为随机抽取驱动器属性在时间序列上的对比示例。表 3属性最终选择结果。表 3.8 基于趋势分析方法选择属性结果表属性FlyHeight6 FlyHeight7 FlyHeight8 FlyHeight9 FlyHeight10FlyHeight11 FlyHeight12 FlyHeight13 Servo2 Servo6PList ReadError18 Writes Servo10
【参考文献】:
期刊论文
[1]基于框图法的网络存储系统可靠性分析[J]. 张英,张益,王冀鲁. 计算机科学. 2010(06)
[2]一种基于S.M.A.R.T的保障RAID数据高可靠性的方法[J]. 刘景宁,饶国林,冯丹. 计算机工程与科学. 2007(05)
博士论文
[1]面向高性能计算的可扩展I/O体系结构研究与实现[D]. 李琼.国防科学技术大学 2009
[2]分布式安全存储系统纠删码技术的研究[D]. 万武南.中国科学院研究生院(成都计算机应用研究所) 2006
硕士论文
[1]高性能磁盘阵列自修复技术研究[D]. 张超.国防科学技术大学 2008
本文编号:3517649
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3517649.html