[Abstract]:With the IC technology entering the nanometer age, the chip is facing the threat of soft error. In addition to the quantitative threat of soft errors, processors also face the threat of varying error rates due to process variability and changes in working conditions such as voltage, temperature, location, etc. That is, the error rate of the system does not remain constant but changes over time. Checkpoint is the main fault-tolerant mechanism in the system, and its overhead is closely related to the interval between checkpoints. At present, the determination of checkpoint interval is mostly based on constant error rate. However, in the case of soft error variation, the adaptive checkpoint method can significantly reduce the checkpoint overhead than the fixed method. It can predict the error rate of the system to ensure that the checkpoint interval of the system is always close to the optimal state. However, the performance improvement achieved by adaptive checkpoint is related to the specific degree of error rate variation. Therefore, this paper studies how the change of soft error rate affects the cost of checkpoint. Based on the influence of temperature, voltage, position and other factors on soft error, a model of error rate variation including amplitude and duration is established, and the error rate model is used to analyze the influence of temperature, voltage and position on soft error. The performance improvement of adaptive checkpoint mechanism under ideal condition is simulated, and an error rate prediction method based on error history is proposed, which verifies the effect of adaptive checkpoint in practice. The experimental results show that when the range of variation is more than 3 times and the duration is more than 12.5%, the performance of this method can be improved in practice.
【作者单位】: 国防科学技术大学计算机学院;
【基金】:国家自然科学基金(61402504,61033008,61272145,61103080) 国家“八六三”高技术研究发展计划项目子课题(2012AA012706) 高等学校博士学科点专项科研基金优先发展领域课题(20124307130004)资助~~
相关期刊论文 前10条
1 朱丹;李暾;李思昆;;形式化等价性检查指导的软错误敏感点筛选[J];计算机辅助设计与图形学学报;2011年03期
2 徐建军;谭庆平;熊磊;叶俊;;一种针对软错误的程序可靠性定量分析方法[J];电子学报;2011年03期
3 熊磊;谭庆平;;基于软错误的动态程序可靠性分析和评估[J];小型微型计算机系统;2011年11期
4 梁华国;黄正峰;王伟;詹文法;;一种双模互锁的容软错误静态锁存器[J];宇航学报;2009年05期
5 龚锐;戴葵;王志英;;片上多核处理器容软错误执行模型[J];计算机学报;2008年11期
6 孙岩;王永文;张民选;;微处理器体系结构级软错误易感性评估[J];计算机工程与科学;2010年11期
7 成玉;马安国;张承义;张民选;;微体系结构软错误易感性阶段特性研究[J];电子科技大学学报;2012年02期
8 张民选;孙岩;宋超;;纳米级集成电路的软错误问题及其对策[J];上海交通大学学报;2013年01期
9 龚锐;戴葵;王志英;;基于现场保存与恢复的双核冗余执行模型[J];计算机工程与科学;2009年08期
10 梁华国;陈凡;黄正峰;;时序敏感的容软错误电路选择性加固方案[J];电子测量与仪器学报;2014年03期
相关会议论文 前7条
1 吴珍妮;梁华国;黄正峰;王俊;陈秀美;曹源;;容软错误的电路选择性加固技术[A];第六届中国测试学术会议论文集[C];2010年
2 熊荫乔;谭庆平;徐建军;;基于软件标签的软错误校验和恢复技术[A];中国通信学会第六届学术年会论文集(上)[C];2009年
3 成玉;张承义;张民选;;微体系结构的软错误易感性评估及其阶段特性研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
4 金作霖;张民选;孙岩;石文强;;栅氧退化效应下纳米级SRAM单元临界电荷分析[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
5 郭御风;郭诵忻;龚锐;邓宇;张明;;一种面向多核处理器I/O系统软错误容错方法[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
6 周彬;霍明学;肖立伊;;单粒子多脉冲的软错误敏感性分析方法[A];第十六届全国核电子学与核探测技术学术年会论文集(上册)[C];2012年
7 梁丽波;梁华国;黄正峰;;基于功能复用的增强型扫描结构ESFF-SEAD[A];2011中国仪器仪表与测控技术大会论文集[C];2011年
相关博士学位论文 前10条
1 焦佳佳;处理器中分析模型驱动的高效软错误量化方法研究[D];上海交通大学;2014年
2 周婉婷;辐照环境中通信数字集成电路软错误预测建模研究[D];电子科技大学;2014年
3 成玉;高性能微处理器动态容软错误设计关键技术研究[D];国防科学技术大学;2012年
4 丁潜;集成电路软错误问题研究[D];清华大学;2009年
5 绳伟光;数字集成电路软错误敏感性分析与可靠性优化技术研究[D];哈尔滨工业大学;2009年
6 黄正峰;数字电路软错误防护方法研究[D];合肥工业大学;2009年
7 孙岩;纳米集成电路软错误分析与缓解技术研究[D];国防科学技术大学;2010年
8 朱丹;基于时序等价性检查的电路软错误系统级可靠性分析方法研究[D];国防科学技术大学;2010年
9 龚锐;多核微处理器容软错误设计关键技术研究[D];国防科学技术大学;2008年
10 景乃锋;面向SRAM型FPGA软错误的可靠性评估与容错算法研究[D];上海交通大学;2012年
相关硕士学位论文 前10条
1 徐东超;面向SystemC的软错误敏感度分析方法[D];上海交通大学;2015年
2 靳丽娜;基于SET传播特性的软错误率研究[D];电子科技大学;2015年
3 潘阿成;一种低功耗抗辐射的TCAM系统设计[D];大连理工大学;2015年
4 彭小飞;纳米工艺下集成电路的容软错误技术研究[D];合肥工业大学;2015年
5 张丽娜;集成电路的容软错误技术研究[D];合肥工业大学;2014年
6 陈凡;数字集成电路容忍软错误加固技术研究[D];合肥工业大学;2014年
7 刘思廷;考虑偏差因素的集成电路软错误分析方法研究[D];哈尔滨工业大学;2014年
8 杨晓;基于合成的多核CPU软错误测试加速研究[D];华中科技大学;2012年
9 汪静;数字集成电路老化故障和软错误的在线检测技术研究[D];合肥工业大学;2013年
10 黄捚;组合电路软错误敏感性分析与加固[D];哈尔滨工业大学;2008年