高可靠处理器体系结构研究
发布时间:2021-05-23 02:50
随着处理器逐步采用纳米级制造工艺,在处理器性能得到大幅提高的同时,由于集成电路特征尺寸的减小、电源电压的降低和频率的升高,使得处理器对于串扰、电压扰动、电磁干扰以及辐射等各种噪声干扰变得更加敏感,并可能引发错误的操作,处理器的可靠性成为一个日益严峻的课题。另一方面,对于航天等特殊应用场合,由于宇宙射线和高能粒子的辐照作用,使得处理器内部电路产生各种单粒子效应,并可能引起严重的事故,因此也对处理器可靠性提出了更高的要求。本文以龙芯1号处理器为研究原型,以瞬态故障引起的软错误为主要研究对象,通过故障行为分析,结合具体的处理器结构设计,从体系结构级探讨了纳米级制造工艺下与高可靠应用场合下处理器的可靠性设计方法,本文研究工作的主要创新点与贡献如下:1.提出一种连续快速的处理器仿真故障注入技术,通过同时运行两个处理器可综合RTL模型,在较短时间内对龙芯1号处理器快速注入了大约30万个软错误,保证了分析结果具有较好的统计意义,可以有效指导后续的可靠性设计。2.提出一种基于软错误敏感性分析的体系结构级低开销容错触发器设计技术,只对龙芯1号处理器中软错误敏感性高于3%的触发器采用容错触发器,节省了81...
【文章来源】:中国科学院大学(中国科学院计算技术研究所)北京市
【文章页数】:124 页
【学位级别】:博士
【文章目录】:
摘要
目录
图目录
表目录
第一章 绪论
1.1 研究背景
1.1.1 开展处理器可靠性研究的必要性
1.1.2 处理器发生软错误的主要原因
1.1.3 冗余技术分类
1.1.4 可靠性衡量指标
1.2 研究现状
1.2.1 在FPGA上实现可重构容错处理器
1.2.2 单芯片处理器的容错与可靠性研究
1.2.3 容错处理器阵列的可靠性研究
1.2.4 计算机系统的可靠性研究
1.2.5 工业界研发现状
1.3 处理器可靠性设计的主要技术
1.3.1 从工艺的角度
1.3.2 从电路设计的角度
1.3.3 从微结构设计的角度
1.3.4 从软件设计的角度
1.4 本文的研究目标与研究方法
1.5 本文的主要贡献
1.6 本文的组织结构
第二章 连续快速的处理器仿真故障注入技术
2.1 引言
2.2 处理器故障注入常用方法
2.2.1 硬件故障注入方法
2.2.2 软件故障注入方法
2.2.3 仿真故障注入方法
2.2.4 混合故障注入方法
2.2.5 电路模拟故障注入方法
2.3 处理器故障模型
2.4 龙芯1号处理器的故障注入方法
2.4.1 仿真故障注入平台
2.4.2 故障注入点
2.4.3 软错误注入过程
2.4.4 故障注入运行效果
2.5 小结
第三章 龙芯1号处理器的软错误敏感性分析
3.1 引言
3.2 龙芯1号处理器软错误敏感性分析
3.2.1 取指与译码部件
3.2.2 操作队列
3.2.3 通用寄存器与浮点寄存器
3.2.4 定点算术逻辑运算单元ALU与定点乘法器MUL
3.2.5 浮点算术逻辑运算单元FALU与浮点乘法器FMUL
3.2.6 地址运算部件
3.2.7 TLB部件
3.2.8 Cache部件
3.2.9 时钟域转换部件与接口部件
3.2.10 软错误敏感性分析小结
3.3 小结
第四章 体系结构级低开销容错触发器设计技术
4.1 引言
4.2 容错触发器单元设计
4.2.1 晶体管级容错触发器
4.2.2 门级容错触发器
4.3 基于软错误敏感性分析的体系结构级低开销容错触发器设计技术
4.4 小结
第五章 处理器片内存储器的可靠性设计技术
5.1 引言
5.2 片内存储器的常用可靠性设计技术
5.2.1 编码检错纠错技术
5.2.2 冗余行列与内建自修复技术
5.2.3 空闲单元关闭技术
5.2.4 dirty数据块提前写回技术
5.2.5 故障隔离技术
5.2.6 高可靠存储单元电路与版图设计技术
5.3 利用局部性减少处理器片内存储器的访问次数
5.3.1 访存部件结构分析
5.3.2 TLB部件初始设计结构分析
5.3.3 Cache部件初始设计结构分析
5.3.4 根据虚拟地址历史记录同时减少TLB和Cache对片内存储器的访问次数
5.3.5 关键路径分析
5.3.6 功耗降低情况分析
5.4 类write-through更新算法
5.4.1 Cache更新算法
5.4.2 write-through更新算法与write-buffer
5.4.3 类write-through更新算法
5.4.4 进一步的编码保护
5.5 小结
第六章 静态检测流水线与选择性重复执行技术
6.1 引言
6.2 常用体系结构级冗余设计技术
6.2.1 时间冗余技术
6.2.2 硬件冗余技术
6.3 静态检测流水线与选择性重复执行技术
6.3.1 龙芯1号处理器的指令执行分布情况和面积分布情况
6.3.2 静态检测流水线技术
6.3.3 选择性重复执行技术
6.3.4 验证环境
6.4 小结
第七章 精确流水线超时恢复技术
7.1 引言
7.2 常用流水线超时恢复技术
7.3 精确流水线超时恢复技术
7.3.1 流水线超时软错误敏感性分析
7.3.2 结果总线增加操作码比较
7.3.3 产生超时例外重新取指执行指令
7.3.4 超时错误敏感触发器超时重置
7.3.5 三模冗余与ECC校验
7.3.6 性能面积开销
7.4 小结
第八章 结束语
8.1 引言
8.2 本文的主要贡献
8.3 进一步的研究工作
参考文献
致谢
作者简历
【参考文献】:
期刊论文
[1]嵌入式处理器TLB设计方法研究[J]. 范东睿,黄海林,唐志敏. 计算机学报. 2006(01)
[2]龙芯1号处理器结构设计[J]. 胡伟武,唐志敏. 计算机学报. 2003(04)
本文编号:3202142
【文章来源】:中国科学院大学(中国科学院计算技术研究所)北京市
【文章页数】:124 页
【学位级别】:博士
【文章目录】:
摘要
目录
图目录
表目录
第一章 绪论
1.1 研究背景
1.1.1 开展处理器可靠性研究的必要性
1.1.2 处理器发生软错误的主要原因
1.1.3 冗余技术分类
1.1.4 可靠性衡量指标
1.2 研究现状
1.2.1 在FPGA上实现可重构容错处理器
1.2.2 单芯片处理器的容错与可靠性研究
1.2.3 容错处理器阵列的可靠性研究
1.2.4 计算机系统的可靠性研究
1.2.5 工业界研发现状
1.3 处理器可靠性设计的主要技术
1.3.1 从工艺的角度
1.3.2 从电路设计的角度
1.3.3 从微结构设计的角度
1.3.4 从软件设计的角度
1.4 本文的研究目标与研究方法
1.5 本文的主要贡献
1.6 本文的组织结构
第二章 连续快速的处理器仿真故障注入技术
2.1 引言
2.2 处理器故障注入常用方法
2.2.1 硬件故障注入方法
2.2.2 软件故障注入方法
2.2.3 仿真故障注入方法
2.2.4 混合故障注入方法
2.2.5 电路模拟故障注入方法
2.3 处理器故障模型
2.4 龙芯1号处理器的故障注入方法
2.4.1 仿真故障注入平台
2.4.2 故障注入点
2.4.3 软错误注入过程
2.4.4 故障注入运行效果
2.5 小结
第三章 龙芯1号处理器的软错误敏感性分析
3.1 引言
3.2 龙芯1号处理器软错误敏感性分析
3.2.1 取指与译码部件
3.2.2 操作队列
3.2.3 通用寄存器与浮点寄存器
3.2.4 定点算术逻辑运算单元ALU与定点乘法器MUL
3.2.5 浮点算术逻辑运算单元FALU与浮点乘法器FMUL
3.2.6 地址运算部件
3.2.7 TLB部件
3.2.8 Cache部件
3.2.9 时钟域转换部件与接口部件
3.2.10 软错误敏感性分析小结
3.3 小结
第四章 体系结构级低开销容错触发器设计技术
4.1 引言
4.2 容错触发器单元设计
4.2.1 晶体管级容错触发器
4.2.2 门级容错触发器
4.3 基于软错误敏感性分析的体系结构级低开销容错触发器设计技术
4.4 小结
第五章 处理器片内存储器的可靠性设计技术
5.1 引言
5.2 片内存储器的常用可靠性设计技术
5.2.1 编码检错纠错技术
5.2.2 冗余行列与内建自修复技术
5.2.3 空闲单元关闭技术
5.2.4 dirty数据块提前写回技术
5.2.5 故障隔离技术
5.2.6 高可靠存储单元电路与版图设计技术
5.3 利用局部性减少处理器片内存储器的访问次数
5.3.1 访存部件结构分析
5.3.2 TLB部件初始设计结构分析
5.3.3 Cache部件初始设计结构分析
5.3.4 根据虚拟地址历史记录同时减少TLB和Cache对片内存储器的访问次数
5.3.5 关键路径分析
5.3.6 功耗降低情况分析
5.4 类write-through更新算法
5.4.1 Cache更新算法
5.4.2 write-through更新算法与write-buffer
5.4.3 类write-through更新算法
5.4.4 进一步的编码保护
5.5 小结
第六章 静态检测流水线与选择性重复执行技术
6.1 引言
6.2 常用体系结构级冗余设计技术
6.2.1 时间冗余技术
6.2.2 硬件冗余技术
6.3 静态检测流水线与选择性重复执行技术
6.3.1 龙芯1号处理器的指令执行分布情况和面积分布情况
6.3.2 静态检测流水线技术
6.3.3 选择性重复执行技术
6.3.4 验证环境
6.4 小结
第七章 精确流水线超时恢复技术
7.1 引言
7.2 常用流水线超时恢复技术
7.3 精确流水线超时恢复技术
7.3.1 流水线超时软错误敏感性分析
7.3.2 结果总线增加操作码比较
7.3.3 产生超时例外重新取指执行指令
7.3.4 超时错误敏感触发器超时重置
7.3.5 三模冗余与ECC校验
7.3.6 性能面积开销
7.4 小结
第八章 结束语
8.1 引言
8.2 本文的主要贡献
8.3 进一步的研究工作
参考文献
致谢
作者简历
【参考文献】:
期刊论文
[1]嵌入式处理器TLB设计方法研究[J]. 范东睿,黄海林,唐志敏. 计算机学报. 2006(01)
[2]龙芯1号处理器结构设计[J]. 胡伟武,唐志敏. 计算机学报. 2003(04)
本文编号:3202142
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3202142.html