星载GPU四余度容错算法设计与实现
发布时间:2021-10-23 03:14
星载计算机之于卫星就像人类大脑之于人体,是卫星非常重要的组成部分,它控制着卫星的运转和星上任务的执行等。因此,星载计算机一旦出现故障就可能导致任务失败,从而造成十分严重的后果,甚至是灾难。然而,由于空间环境的情况恶劣以及当前软硬件条件的限制,星载计算机的安全需要得到有效的保障。另一方面,由于卫星的应用领域越来越广,要求星载计算机硬件具有高性能、低功耗、体积小、重量轻等特点。近些年来高速发展的GPU软硬件技术可以解决这一需求问题,GPU强大的计算能力不仅可以完成大规模密集型任务的计算,而且其功耗和成本相较于其他的宇航级芯片也大大降低。但是,由于芯片集成度的提升和工作电压的降低等因素会导致GPU更容易发生瞬时故障。所以,将GPU应用于航空航天这类对可靠性要求极高的领域时,需要采用合适的容错技术对其进行容错设计,以提高它的可靠性从而降低故障率。本文深入研究和对比了各种容错方法的适用情形和优缺点,着重研究了软硬件容错技术。为了兼顾系统高可靠性和低设计复杂度两个方面,采用四余度进行容错设计。本文选取以Linux为操作系统的NVIDIA Jetson TX2作为星载GPU,基于GPU的硬件特点和软...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:83 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 课题研究内容背景及意义
1.1.1 研究背景及意义
1.1.2 研究内容及意义
1.2 国内外研究现状与发展趋势
1.2.1 国内外研究现状
1.2.2 发展趋势
1.3 本文的主要贡献与创新
1.4 本论文的结构安排
第二章 余度容错技术研究
2.1 计算机故障及分类
2.2 余度定义及分类
2.2.1 余度的定义
2.2.2 余度的分类
2.3 容错技术
2.3.1 硬件冗余
2.3.2 软件冗余
2.3.3 时间冗余
2.3.4 信息冗余
2.4 本章小结
第三章 GPU&CUDA架构
3.1 GPU及其架构
3.1.1 计算机架构
3.1.2 CPU与GPU
3.2 CUDA并行技术
3.2.1 引言
3.2.2 CUDA编程模型
3.2.3 CUDA执行模型
3.2.4 CUDA存储器模型
3.3 本章小结
第四章 星载GPU四余度容错算法设计
4.1 余度选择
4.2 表决机制
4.3 基于CUDA的四余度容错方案设计
4.3.1 基于简单复算的四余度容错模式
4.3.2 基于并行检错的四余度容错模式
4.3.3 基于任务并行的四余度容错模式
4.3.4 基于结果比较算法的四余度容错模式
4.3.5 基于任务并行和比较算法的四余度容错模式
4.3.6 基于多版本kernel的四余度容错模式
4.3.7 基于多版本kernel和比较算法的四余度容错模式
4.3.8 基于任务并行和比较算法的多版本kernel四余度容错模式
4.3.9 基于流计算模式的四余度容错模式
4.3.10 基于多GPU的四余度容错模式
4.4 基于冗余进程的软件容错方案
4.4.1 PLR算法
4.4.2 检查点与恢复技术
4.4.3 四余度进程容错方案设计
4.5 本章小结
第五章 实验测试和数据分析
5.1 NVIDIAJetsonTX2简介
5.2 实验测试与性能分析
5.3 实验伪码
5.4 可靠性分析
5.4.1 可靠性描述
5.4.2 可靠性建模
5.4.3 可靠性计算
5.5 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
【参考文献】:
期刊论文
[1]基于马尔可夫链的构件软件可靠性评估模型[J]. 唐佩佳,谢永杰,吴安波,焦姣. 计算机应用. 2016(S2)
[2]容错飞行控制技术的应用研究现状与发展趋势[J]. 王发威,廖开俊. 飞行力学. 2017(01)
[3]混合三余度无人机飞控计算机硬件结构设计及可靠性分析[J]. 陈喆,杨蕊姣,徐义华,李志宇. 计算机测量与控制. 2015(08)
[4]一种基于GPU通用计算的容错方法[J]. 徐丹妮,贺占庄. 微电子学与计算机. 2014(02)
[5]一种基于冗余线程的GPU多副本容错技术[J]. 贾佳,杨学军,李志凌. 计算机研究与发展. 2013(07)
[6]非相似余度飞控计算机设计及可靠性分析[J]. 周小超,陆熊. 计算机与现代化. 2013(05)
[7]面向高端容错计算机的进程容错系统设计与实现[J]. 吴楠,张东,刘璧怡. 计算机应用与软件. 2013(04)
[8]三余度飞控计算机架构及其可靠性研究[J]. 柳孔明,徐宏哲,黄俊. 现代电子技术. 2012(06)
[9]一种面向CPU-GPU异构系统的容错方法[J]. 徐新海,杨学军,林宇斐,林一松,唐滔. 软件学报. 2011(10)
[10]微小卫星星载计算机系统可靠性研究与设计[J]. 姜连祥,杨根庆,李华旺,胡伟圣,许培培. 系统工程与电子技术. 2009(01)
博士论文
[1]异构并行计算机容错技术研究[D]. 贾佳.国防科学技术大学 2011
[2]高效能GPGPU体系结构关键技术研究[D]. 马安国.国防科学技术大学 2011
硕士论文
[1]基于PowerPC和x86的混合余度无人机飞控计算机内核技术研究[D]. 杨蕊姣.南京航空航天大学 2015
[2]Linux内核级多进程任务容错技术研究[D]. 赵得润.哈尔滨工程大学 2015
[3]二余度飞控计算机仿真平台研制与应用[D]. 段晓军.西北工业大学 2005
本文编号:3452363
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:83 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 课题研究内容背景及意义
1.1.1 研究背景及意义
1.1.2 研究内容及意义
1.2 国内外研究现状与发展趋势
1.2.1 国内外研究现状
1.2.2 发展趋势
1.3 本文的主要贡献与创新
1.4 本论文的结构安排
第二章 余度容错技术研究
2.1 计算机故障及分类
2.2 余度定义及分类
2.2.1 余度的定义
2.2.2 余度的分类
2.3 容错技术
2.3.1 硬件冗余
2.3.2 软件冗余
2.3.3 时间冗余
2.3.4 信息冗余
2.4 本章小结
第三章 GPU&CUDA架构
3.1 GPU及其架构
3.1.1 计算机架构
3.1.2 CPU与GPU
3.2 CUDA并行技术
3.2.1 引言
3.2.2 CUDA编程模型
3.2.3 CUDA执行模型
3.2.4 CUDA存储器模型
3.3 本章小结
第四章 星载GPU四余度容错算法设计
4.1 余度选择
4.2 表决机制
4.3 基于CUDA的四余度容错方案设计
4.3.1 基于简单复算的四余度容错模式
4.3.2 基于并行检错的四余度容错模式
4.3.3 基于任务并行的四余度容错模式
4.3.4 基于结果比较算法的四余度容错模式
4.3.5 基于任务并行和比较算法的四余度容错模式
4.3.6 基于多版本kernel的四余度容错模式
4.3.7 基于多版本kernel和比较算法的四余度容错模式
4.3.8 基于任务并行和比较算法的多版本kernel四余度容错模式
4.3.9 基于流计算模式的四余度容错模式
4.3.10 基于多GPU的四余度容错模式
4.4 基于冗余进程的软件容错方案
4.4.1 PLR算法
4.4.2 检查点与恢复技术
4.4.3 四余度进程容错方案设计
4.5 本章小结
第五章 实验测试和数据分析
5.1 NVIDIAJetsonTX2简介
5.2 实验测试与性能分析
5.3 实验伪码
5.4 可靠性分析
5.4.1 可靠性描述
5.4.2 可靠性建模
5.4.3 可靠性计算
5.5 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
【参考文献】:
期刊论文
[1]基于马尔可夫链的构件软件可靠性评估模型[J]. 唐佩佳,谢永杰,吴安波,焦姣. 计算机应用. 2016(S2)
[2]容错飞行控制技术的应用研究现状与发展趋势[J]. 王发威,廖开俊. 飞行力学. 2017(01)
[3]混合三余度无人机飞控计算机硬件结构设计及可靠性分析[J]. 陈喆,杨蕊姣,徐义华,李志宇. 计算机测量与控制. 2015(08)
[4]一种基于GPU通用计算的容错方法[J]. 徐丹妮,贺占庄. 微电子学与计算机. 2014(02)
[5]一种基于冗余线程的GPU多副本容错技术[J]. 贾佳,杨学军,李志凌. 计算机研究与发展. 2013(07)
[6]非相似余度飞控计算机设计及可靠性分析[J]. 周小超,陆熊. 计算机与现代化. 2013(05)
[7]面向高端容错计算机的进程容错系统设计与实现[J]. 吴楠,张东,刘璧怡. 计算机应用与软件. 2013(04)
[8]三余度飞控计算机架构及其可靠性研究[J]. 柳孔明,徐宏哲,黄俊. 现代电子技术. 2012(06)
[9]一种面向CPU-GPU异构系统的容错方法[J]. 徐新海,杨学军,林宇斐,林一松,唐滔. 软件学报. 2011(10)
[10]微小卫星星载计算机系统可靠性研究与设计[J]. 姜连祥,杨根庆,李华旺,胡伟圣,许培培. 系统工程与电子技术. 2009(01)
博士论文
[1]异构并行计算机容错技术研究[D]. 贾佳.国防科学技术大学 2011
[2]高效能GPGPU体系结构关键技术研究[D]. 马安国.国防科学技术大学 2011
硕士论文
[1]基于PowerPC和x86的混合余度无人机飞控计算机内核技术研究[D]. 杨蕊姣.南京航空航天大学 2015
[2]Linux内核级多进程任务容错技术研究[D]. 赵得润.哈尔滨工程大学 2015
[3]二余度飞控计算机仿真平台研制与应用[D]. 段晓军.西北工业大学 2005
本文编号:3452363
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/3452363.html