基于国产多核处理器的容错冗余进程检测技术的研究
发布时间:2017-10-02 16:18
本文关键词:基于国产多核处理器的容错冗余进程检测技术的研究
【摘要】:集成电路制造工艺的不断发展使得微处理器计算的可靠性面临着瞬时故障的严重威胁,尤其是在超深亚微米级别,瞬时故障发生的机率将大大增加。同时由于计算机体系结构的快速发展,当前的微处理器已经进入多核时代。因此,有必要针对多核计算平台下的容错技术展开深入研究。针对微处理器的瞬时故障容错技术的研究,目前已经深入到计算机体系结构中的处理器层、操作系统层、编译层和应用程序层。 本文首先对故障进行了介绍,并从故障对应用程序执行正确性的角度对故障进行了分类。在对故障有了充分的认识之后,对目前在软硬件容错方面的容错技术进行了充分研究,其中对硬件容错技术进行了简单的介绍,对从软件体系结构的各个层次的角度对软件容错技术进行了详细的研究,包括操作系统层、编译层以及应用程序层。在充分研究了各种容错技术之后,针对目前的国产多核处理器平台,提出了一种在操作系统层面基于系统调用的进程冗余检测技术,并对该技术的设计原理进行了详细的介绍,包括其中的缓存模块、检测模块、同步模块等。 最后,在国产龙芯多核处理器计算平台下,在linux内核级实现并验证了该检测技术方案。实验结果表明,本检测方案能够充分利用多核处理器的并行计算能力,,检测到由于瞬时故障引发的系统错误,并满足一定的性能要求。
【关键词】:龙芯 冗余进程 操作系统容错 瞬时故障
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP332
【目录】:
- 摘要4-5
- Abstract5-6
- 目录6-8
- 第1章 绪论8-12
- 1.1 课题来源及研究的目的与意义8-9
- 1.1.1 课题来源8
- 1.1.2 课题研究的背景与意义8-9
- 1.2 国内外研究现状9-11
- 1.2.1 龙芯处理器9-10
- 1.2.2 软硬件容错技术现状10-11
- 1.3 论文的主要内容11-12
- 第2章 容错技术及相关研究12-28
- 2.1 故障12-14
- 2.1.1 故障的概念12-13
- 2.1.2 故障的分类13-14
- 2.2 软硬件容错技术14-27
- 2.2.1 硬件容错技术14-16
- 2.2.2 软件容错技术16-27
- 2.3 本章小结27-28
- 第3章 容错冗余进程检测方案28-42
- 3.1 各种软件容错技术分析比较28
- 3.2 冗余进程检测方案SoR划分28-30
- 3.3 冗余进程检测方案原理30-39
- 3.3.1 缓存模块33-35
- 3.3.2 同步模块35-37
- 3.3.3 Watchdog37-38
- 3.3.4 其他两个模块38-39
- 3.4 进程执行模型39-40
- 3.5 本章小结40-42
- 第4章 冗余进程检测方案验证42-56
- 4.1 软硬件平台42
- 4.2 基于龙芯处理器的 linux 内核编译42-43
- 4.3 linux 内核中添加系统调用与数据结构43-46
- 4.3.1 内核中添加系统调用43-46
- 4.3.2 内核中添加数据结构46
- 4.4 检测方案实现46-49
- 4.4.1 缓存模块47
- 4.4.2 同步模块47-48
- 4.4.3 检测模块和故障恢复模块48
- 4.4.4 检测系统系统调用接口48-49
- 4.5 实验结果与分析49-55
- 4.5.1 正确性验证49-52
- 4.5.2 性能损耗分析52-55
- 4.6 本章小结55-56
- 结论56-57
- 参考文献57-62
- 攻读学位期间发表的学术论文62-64
- 致谢64
【参考文献】
中国期刊全文数据库 前10条
1 邱金娟;徐宏杰;潘雄;朱明达;;SRAM型FPGA单粒子翻转测试及加固技术研究[J];电光与控制;2011年08期
2 ;MICROTHREAD BASED (MTB) COARSE GRAINED FAULT TOLERANCE SUPERSCALAR PROCESSOR ARCHITECTURE[J];Journal of Electronics;2006年03期
3 吴江;唐常杰;李太勇;姜s
本文编号:960590
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/960590.html