当前位置:主页 > 科技论文 > 计算机论文 >

处理器中分析模型驱动的高效软错误量化方法研究

发布时间:2020-11-09 19:37
   随着工艺尺寸的缩小,软错误引发的粒子翻转成为导致处理器运行结果失效的主导性因素。为了权衡设计开销(如:面积等)和可靠性,精确高效的软错误量化方法成为指导容错优化方案设计的关键。当前软错误量化挑战集中表现:“精度-效率难权衡”,“多位翻转(Multi-Cell Upsets,MCU)比例急剧增加导致量化复杂度高”以及“当前量化方法无法很好适应大规模众核处理器结构”等三个方面。针对这些问题,本文基于模型分析驱动的思路分别提出了对应的优化方案:1)本文针对精度-效率难权衡的问题,对软错误在传播过程中的屏蔽效应的充分观察和分析,设计了基于概率图模型(Probabilistic Graphical Models,PGM)驱动的评估精度和效率系统优化方法,并通过三种不同的复杂度和精度权衡的实现方式得到不同的评估的精度-效率优化结果,可灵活应用不同的应用场景,包括:i)MEA-PGM-FO方案快速考虑一阶屏蔽效应提供更优的评估上界,相比仿真注入方法(Fault Injection,FI)保持52x加速比的同时把上界高估幅度降低了最优45.96%和平均8.48%,适合于高效高可靠性设计如汽车控制系统;ii)MEA-PGM-HMM方案采用启发式模型得到快速精确的近似评估值,达到59x加速比的同时把高估的上界值减少了最优98.18%和平均79.14%,适合于面向流处理等低可靠设计的高效量化环境;iii)MEA-PGM-HO是基于截断式推断的高精度高效优化方案,保持43.87x加速比的同时可以把高估的上界值缩小了最优95%和平均87.28%,更适合于航空和航天等极度可靠的场景。2)本文针对复杂的MCU问题设计了基于直方图分析的边界模型(Histogram based Boundary Model,Hi Bo M)驱动的量化方法,一方面利用SBU快速高效量化方法(如错误屏蔽感知的系列优化方案)的统计结果基于边界模型评估面向MCU的量化指标上界和下界;另一方面还采用仿真划分的方式进行分段的边界模型评估,从而得到浮动范围更小的评估区间。它能有效的把MCU问题简化为1位翻转(Single Bit Upset,SBU),灵活扩展到了任意SBU的量化评估方法,并快速得到高精度的评估值,仿真结果指出与精确的错误注入方法相比,可达到44.67~94.6x加速比。3)本文还针对新的处理器结构众核片上网络(Network on Chip,No C)的软错误量化方法从网络结构量化和处理器部件量化两个角度分别提出了:基于PRP的并发注入量化方法和面向MCU的预分析加速注入统计方法,前者首先从分析模型的角度定义了PRP量化指标,并以No C特有的可靠性感知链路添加为例进行了系统验证,通过1次(或少数几次)仿真快速统计PRP值验证软错误的影响以及容错方案的有效;后者面向更精确的SBU+MCU错误模型提出了基于细粒度量化评价的预分析加速统计方法MEPA,通过应用程序的通信特性、可靠性方案的容错能力以及本征的错误屏蔽等可预测信息取消或中断不必要的仿真实现5x加速比。总之,本文基于分析模型驱动的思路,设计、实现和验证了一系列量化方案MEA-PGM-FO、MEA-PGM-HMM、MEA-PGM-HO、Hi Bo M、PRP以及MEPA等,有效解决了面向处理器软错误量化方法面临的精度-效率难权衡的固有问题,MCU新软错误模型以及众核新处理器结构等挑战。
【学位单位】:上海交通大学
【学位级别】:博士
【学位年份】:2014
【中图分类】:TP332
【文章目录】:
摘要
ABSTRACT
符号说明与缩略语表
第一章 绪论
    1.1 研究背景
        1.1.1 软错误
        1.1.2 处理器
        1.1.3 面向处理器的软错误量化问题
    1.2 研究动机
        1.2.1 相关工作
        1.2.2 关键挑战
    1.3 创新点
    1.4 论文的组织结构
    1.5 本章小结
第二章 软错误量化的背景知识和验证平台
    2.1 基本概念和方法
        2.1.1 软错误量化指标AVF
        2.1.2 典型AVF评估方法FI和ACE
        2.1.3 概率图模型(PGM)
    2.2 多位翻转(MCU)的错误模型
    2.3 软错误量化的验证平台
        2.3.1 单核
        2.3.2 众核NoC
    2.4 本章小结
第三章 面向单核SBU的概率图模型驱动的量化方法研究
    3.1 面向单核SBU的软错误量化问题描述和定义
        3.1.1 目标对象
        3.1.2 形式化的问题描述
    3.2 观察和分析:错误屏蔽和错误蔓延
        3.2.1 错误屏蔽
        3.2.2 错误蔓延
        3.2.3 错误屏蔽和错误蔓延的联合效应
    3.3 错误屏蔽感知的PGM优化方法
        3.3.1 贝叶斯网络映射与表达
        3.3.2 结构(依赖子图)学习
        3.3.3 节点参数学习
        3.3.4 VE推断算法
    3.4 PGM优化方法的三种不同实现方案
        3.4.1 基于一阶屏蔽效应的快速分析方法(MEA-PGM-FO)
        3.4.2 启发式快速近似量化模型(MEA-PGM-HMM)
        3.4.3 基于多阶屏蔽的截断式推断量化方法(MEA-PGM-HO)
    3.5 基于仿真的PGM优化方案验证
        3.5.1 评估精度对比
        3.5.2 评估速度对比
        3.5.3 截断式推断的参数效应
        3.5.4 三种实现方案综合对比
    3.6 本章小结
第四章 面向单核MCU的边界分析模型驱动的量化方法研究
    4.1 面向单核MCU软错误量化问题描述和定义
        4.1.1 目标对象
        4.1.2 形式化的问题描述
    4.2 基于直方图的边界模型优化方案Hi Bo M方法
        4.2.1 边界模型
        4.2.2 基于直方图的间隔分析
        4.2.3 Hi Bo M完整算法
    4.3 基于仿真的Hi Bo M验证
        4.3.1 SBU评估方法对Hi Bo M量化结果的影响
        4.3.2 基于直方图的间隔数对Hi Bo M量化结果的影响
        4.3.3 HiBoM的综合评价
    4.4 本章小结
第五章 面向众核No C的预分析模型驱动的软错误量化方法研究
    5.1 面向众核No C的软错误量化方法的问题描述和定义
        5.1.1 目标对象
        5.1.2 形式化的问题描述
    5.2 基于PRP量化体系的并发注入统计方法
        5.2.1 方法描述
        5.2.2 仿真验证
    5.3 面向MCU的预分析加速统计方法
        5.3.1 方法描述
        5.3.2 仿真验证
    5.4 本章小节
第六章 总结与展望
    6.1 工作小结
    6.2 未来工作展望
    6.3 本章小节
参考文献
附录 1:alpha-21264基于操作码的指令级错误屏蔽因子计算表
附录 2:alpha-21264基于位扩展的指令级错误屏蔽因子计算表
附录 3:alpha-21264基于消毒指令的指令级错误屏蔽因子计算表
攻读博士学位期间已发表或录用的论文
攻读博士学位期间参与的科研项目
致谢

【相似文献】

相关期刊论文 前10条

1 朱丹;李暾;李思昆;;形式化等价性检查指导的软错误敏感点筛选[J];计算机辅助设计与图形学学报;2011年03期

2 徐建军;谭庆平;熊磊;叶俊;;一种针对软错误的程序可靠性定量分析方法[J];电子学报;2011年03期

3 熊磊;谭庆平;;基于软错误的动态程序可靠性分析和评估[J];小型微型计算机系统;2011年11期

4 梁华国;黄正峰;王伟;詹文法;;一种双模互锁的容软错误静态锁存器[J];宇航学报;2009年05期

5 龚锐;戴葵;王志英;;片上多核处理器容软错误执行模型[J];计算机学报;2008年11期

6 孙岩;王永文;张民选;;微处理器体系结构级软错误易感性评估[J];计算机工程与科学;2010年11期

7 成玉;马安国;张承义;张民选;;微体系结构软错误易感性阶段特性研究[J];电子科技大学学报;2012年02期

8 张民选;孙岩;宋超;;纳米级集成电路的软错误问题及其对策[J];上海交通大学学报;2013年01期

9 龚锐;戴葵;王志英;;基于现场保存与恢复的双核冗余执行模型[J];计算机工程与科学;2009年08期

10 梁华国;陈凡;黄正峰;;时序敏感的容软错误电路选择性加固方案[J];电子测量与仪器学报;2014年03期


相关博士学位论文 前9条

1 焦佳佳;处理器中分析模型驱动的高效软错误量化方法研究[D];上海交通大学;2014年

2 成玉;高性能微处理器动态容软错误设计关键技术研究[D];国防科学技术大学;2012年

3 丁潜;集成电路软错误问题研究[D];清华大学;2009年

4 绳伟光;数字集成电路软错误敏感性分析与可靠性优化技术研究[D];哈尔滨工业大学;2009年

5 黄正峰;数字电路软错误防护方法研究[D];合肥工业大学;2009年

6 孙岩;纳米集成电路软错误分析与缓解技术研究[D];国防科学技术大学;2010年

7 朱丹;基于时序等价性检查的电路软错误系统级可靠性分析方法研究[D];国防科学技术大学;2010年

8 龚锐;多核微处理器容软错误设计关键技术研究[D];国防科学技术大学;2008年

9 景乃锋;面向SRAM型FPGA软错误的可靠性评估与容错算法研究[D];上海交通大学;2012年


相关硕士学位论文 前10条

1 徐东超;面向SystemC的软错误敏感度分析方法[D];上海交通大学;2015年

2 靳丽娜;基于SET传播特性的软错误率研究[D];电子科技大学;2015年

3 刘思廷;考虑偏差因素的集成电路软错误分析方法研究[D];哈尔滨工业大学;2014年

4 杨晓;基于合成的多核CPU软错误测试加速研究[D];华中科技大学;2012年

5 汪静;数字集成电路老化故障和软错误的在线检测技术研究[D];合肥工业大学;2013年

6 黄鋆;组合电路软错误敏感性分析与加固[D];哈尔滨工业大学;2008年

7 金作霖;栅氧退化效应下SRAM软错误分析与加固技术研究[D];国防科学技术大学;2011年

8 曹源;有限状态机的容软错误及低功耗设计[D];合肥工业大学;2010年

9 吕文欢;高速CAM抗软错误设计与实现[D];大连理工大学;2014年

10 宋超;逻辑电路软错误率评估模型设计与实现[D];国防科学技术大学;2010年



本文编号:2876877

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2876877.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5ca4f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com