当前位置:主页 > 科技论文 > 计算机论文 >

面向安腾2处理器的故障注入工具设计与实现

发布时间:2020-10-09 10:42
   如今计算机系统已经在一些关键的行业(如民航订票系统、银行结算系统、证券交易系统等)得到广泛应用,这些计算机系统可靠稳定的运行起着非常关键的作用。在这些领域的高端容错服务器中,安腾家族处理器因其主要面向关键任务和数据密集型计算市场,常常是其首选。Intel宣称,全球电信运营商百强企业中已有八十家部署了安腾服务器。因此,面向安腾服务器的可靠性评估与测量是非常有意义的。 本文采用基于故障注入的方法实现对系统可靠性的评估,即使用软件或硬件方法向系统注入故障,观察系统在模拟真实故障下的表现达到对容错性能评估的目的。首先对国内外各种故障注入方法和工具进行了研究和分析,然后根据安腾服务器的软硬件特点,设计并实现了一种操作系统层模拟处理器故障注入工具,可以向目标处理器运行关键的50个寄存器注入固定0、固定1以及翻转等多种故障模型,可通过设置永久、瞬时、间歇等时间类型来控制故障的持续时间和注入频率。 操作系统层模拟的处理器故障注入虽能在一定程度上模拟处理器的一些故障,但其不能深入处理器内部结构,故而无法做到对处理器的一些内部结构独立测试,且模拟的故障也不够贴近真实。因此本文又开发了固件层处理器故障注入工具,故障注入基于IA-64架构处理器提供的固件实现,可向目标处理器注入处理核心失效、Cache、TLB、Register File各结构机器检查错误,Cache内容失效等一系列故障。最后通过一系列实际故障注入实验,证实了本文设计的两种面向安腾2处理器的故障注入工具的有效性,并指出其在评测系统可靠性方面可发挥的重要作用。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2010
【中图分类】:TP332
【部分图文】:

系统软件


Linux系统软件结构

故障注入,操作系统,寄存器,内存


因而还需要系统状态监控器。其整体解决方案如图 2-5 所示。需要重意的是,必须保证所获得的内核数据的一致性,我们通过探测器的处理中访问临界资源前加锁解决此问题。首先,通过结果回收器建立探测点采集内核信息,其采集到的每条信息一个记录,内核专门开辟一块可以容纳 N 条记录的循环缓冲区。缓冲区满时,不再写入信息,只更新缓冲区当前指针(index),用户根据ex 是否连续判断出信息丢失与否。每指定数目(batch_count)条记录就唤核线程 Reporter,批量处理有利于系统性能,N 和 batch_count 的取值于具体情况。

结构图,监测器,系统状态,结构图


系统状态监测器结构图

【引证文献】

相关硕士学位论文 前5条

1 刘璧怡;Linux操作系统内核可靠性评测方法研究[D];哈尔滨工业大学;2011年

2 庞东贺;基于STAF的分布式自动化可用性评测平台的设计与实现[D];哈尔滨工业大学;2011年

3 罗宗扬;基于JTAG的CPU故障注入工具的设计与实现[D];哈尔滨工业大学;2011年

4 唐志敏;基于CPCI总线的故障模拟系统的研究与实现[D];哈尔滨工业大学;2011年

5 王力;高端容错计算机系统监测平台的设计与实现[D];哈尔滨工业大学;2011年



本文编号:2833588

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2833588.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cd4d9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com