当前位置:主页 > 科技论文 > 计算机论文 >

宇航处理器Cache系统的可靠性分析和加固研究

发布时间:2020-09-14 10:00
   随着处理器逐步采用纳米级的制造工艺,其集成度越来越高,电路特征尺寸越来越小,这使得处理器对于电磁干扰和辐射等噪声干扰变得越发敏感,从而可能引起错误的发生以及整个系统的错误操作。同时,对于应用在航天等空间辐射环境中的处理器,由于宇宙射线和高能粒子的辐射作用,容易导致处理器内部集成电路产生各种单粒子效应,进而引起系统的失效。因此,处理器的可靠性研究成为一个日益严峻的课题。 本文以某处理器的Cache系统为研究原型,以单粒子效应引起的软错误为研究对象,采用基于仿真的故障注入方法,对该Cache系统进行了可靠性评估,同时探讨了可靠性加固设计的方法,并且利用仿真模拟器验证了可靠性加固设计方法的有效性,对Cache系统可靠性设计具有一定的理论意义,是在纳米级的制造工艺下处理器可靠性设计的一个有益探索。 本文主要的研究内容与研究成果包括以下几点: (1)对空间辐射环境及其对处理器的影响进行了研究,总结了空间辐射效应的常见类型,分析了其中最为常见的单粒子翻转事件的产生机理。 (2)对可靠性评估分析方法进行了研究,着重探讨了基于故障注入的可靠性评估和基于解析模型的可靠性评估,提出了在本文研究原型Cache系统基础上搭建的可靠性评估平台,同时对研究原型进行了软错误敏感性分析。 (3)对可靠性加固设计方法进行了研究,在对集成电路常见加固设计方法总结的基础上,特别针对Cache系统的可靠性加固方法进行了分析,同时对本文研究原型进行了可靠性加固设计,并且利用Modelsim模拟器验证了其采用可靠性加固设计的有效性。
【学位单位】:上海交通大学
【学位级别】:硕士
【学位年份】:2011
【中图分类】:TP332;V443
【部分图文】:

可靠性测试,环境,故障注入


. 葡萄牙的 RIFLE 故障注入器[27]。它是专门针对处理器可靠性评估的障注入器。它通过一个插座将处理器和系统的其他部分分离开来,之间的信号,并且对其进行修改来达到故障注入的目的。故障触发采用基于地址的故障触发,而且它引入触发地址技术这一个故障参将故障注入到程序循环的内部。它的由用户指定范围的故障生成器便的测试它所希望的系统性能。针对现代处理器的所采用的 Cache 技术,它提出了独特的注入结果分析方法。一个有效的故障必须首然后保证这些错误不是在失效的高速缓存中或者丢弃的指令预取队换插座,RIFLE 可以对不同的处理器进行故障注入。. ERC32 可靠性验证采用的是一种非接触式的硬件故障注入方式,它图 3-1 所示[4]。系统主要分为两部分:待测的处理器 ERC32 和上位机观测 ERC32 在故障注入条件下的执行状态。注入的故障是一重离辐射源出现的离子密度和能量是可以通过一定程序加以控制,以模辐射环境,同时也可以检测 ERC32 在不同的辐射环境下的可靠度。

框图,加固方法,可靠性,框图


图 4-9 Cache 可靠性加固方法 SSI 构框图[42]Fig.4- 9 The structure of selective set invalidation文献[43]提出了一种准确分析 cache 可靠性的方法,并且给出了三种不同的技术用来降低 L1 cache 的软错误敏感性,分别是:(1) Flushing,操作系统用来保持数据正确性的一种机制,可以用来减小 cache的敏感性。Flushing 通过减少 Cache 中关键内容的存活时间来提高可靠性。这样,关键内容在有机会发生错误之前就被踢出了 cache。(2) 存储策略采用 write through 方式。因为,在 write-back 策略中,一个 word写入 cache block 中会导致整个 block 中的数据和 tag/status 位变成脆弱部分,直到该 block 被替换和写入主存储器中。而 write-through策略中,该 block 会立刻写入主存储器中使其不再脆弱。(3) 周期地从 L2 cache 中刷新 L1 cache 中的内容。文献[44]提出了两种 refetching 的算法来提高 Cache 的可靠性,一种是基于静态的方法,一种是基于事件驱动的方法。其中:(1) Static Method:按照一定顺序选择 cache 中的 blocks,在预定的时间间隔后对随后的 block 进行 refetch,类似于 DRAM refreshcontroller。使用这种方法,可

框图,加固方法,可靠性,框图


上海交通大学硕士学位论文。ICR 复制 hot data blocks ( recently accessed cachche 空间中。可以将长时间没有接入的 blocks 叫做可能被逐出的数据。因此,这些 blocks 可以被用来内容被检测到发生软错误时,它的备份可以用来纠是基于对 hot data 进行备份的方法来提高 cache 可来存放有效数据的备份,与文献[45]中的 ICR 方法放位置的准则,该文章使用了一个叫做 shadow c以用来记录备份数据的信息。下图为将 SC 集成到

【参考文献】

相关期刊论文 前3条

1 贺朝会,李国政,罗晋生,刘恩科;CMOS SRAM单粒子翻转效应的解析分析[J];半导体学报;2000年02期

2 贺朝会,耿斌,何宝平,姚育娟,李永宏,彭宏论,林东生,周辉,陈雨生;大规模集成电路总剂量效应测试方法初探[J];物理学报;2004年01期

3 郭红霞,张义门,陈雨生,周辉,肖伟坚,龚仁喜,贺朝会,龚建成;MOSFET单粒子翻转效应的二维数值模拟[J];西安电子科技大学学报;2002年04期

相关博士学位论文 前1条

1 朱丹;基于时序等价性检查的电路软错误系统级可靠性分析方法研究[D];国防科学技术大学;2010年

相关硕士学位论文 前4条

1 陈微;高可靠微处理器设计关键技术研究与实现[D];国防科学技术大学;2006年

2 包斌;航空高可靠处理器容错设计与实现[D];国防科学技术大学;2007年

3 石轩;新型抗SEU存储器读写结构及ECC编码方法研究[D];西安电子科技大学;2009年

4 王振;抗辐射加固SRAM设计与测试[D];国防科学技术大学;2010年



本文编号:2818037

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2818037.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f21ba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com