当前位置:主页 > 科技论文 > 计算机论文 >

高效处理器容错技术研究与实现

发布时间:2019-09-29 19:09
【摘要】:随着工艺技术的不断进展,微处理器变得越来越容易受到瞬态故障的影响,可靠性成为处理器当前面临的重大挑战。面向瞬态故障,本文从故障传播行为分析的角度研究了多核处理器的可靠性问题,研究了高效容错多核处理器的设计与实现技术。取得的主要研究成果如下: 1、分析了故障在单个线程内的传播行为。基于检查点方法对程序进行分段容错的现状,我们采用数据流分析方法,分析了硬件故障所引起的数据错误随指令执行的传播行为,分析了故障在单个线程内的段间传播行为,建立了相应的错误传播方程和算法。并提出了基于已知错误的故障定位分析方法,得到了避免故障跨段传播,所需检查数据的最小集合。故障在单个线程内的传播行为分析理论,能够指导处理器核的检错和容错设计。 2、分析了故障跨线程的传播行为。具体包括:分析了共享存储并行程序的分段结构;研究了故障在不同并行分段结构上的传播行为,发现杂环结构是产生故障向后污染传播的根本原因;证明了通过修改分段方式能够将杂环和纯环结构转换成无环结构,以避免故障向后污染传播行为的发生;发现了弱存储一致性模型对故障跨线程传播行为的影响。故障跨线程的传播行为分析理论,能够指导多核处理器的检错和容错设计。 3、根据故障在单个线程内的传播行为分析,提出了BRO-SOC(BackwardRecovery Oriented Sphere of Correctness)框架的概念,BRO-SOC归纳了故障的检测和隔离边界与系统的存储层次之间的关系,并定义了一个正确性域,随着计算的进行,程序可以分段式地步进,SOC域内的功能部件和程序状态具备逻辑上维持正确性的能力。在BRO-SOC框架下,提出了一种新的基于时间冗余技术的容错处理器核结构DoubleRun,其基本思想是将程序以时间冗余的方式分段执行(即容错事务),确保其中无故障产生后再提交新产生的程序状态。其创新之处在于:(1)使用时间冗余机制容忍系统中的瞬态故障,省去了空间冗余执行方案中的核间队列与核间输出比较通道;(2)将故障检测、隔离边界设定在SOC框架中适当的存储层次,缩小了故障的传播距离和检测延时,减小了前瞻现场规模及维护前瞻现场的硬件开销,且避免由于改动流水线而导致的性能下降;(3)使用写操作的输出作为故障检测手段,并用CRC算法将所有写操作的信息编码到指纹中,,通过对比指纹检测故障使故障检测机制更高效;(4)用纯硬件方式实现正确性域之内的检查点,使检查点的创建和维护开销很小。 4、根据故障跨线程的传播行为分析,提出了多核并行计算平台的DoubleRun结构——DoubleRun-MP,设计实现了DoubleRun-MP并行容错处理器结构。DoubleRun-MP使容错事务的执行、验证和提交过程可分布式、本地化地完成,无需进行全局同步,增加了系统的可扩展性。DoubleRun-MP设计了PSB缓冲机制,支持处理器核中同时维护多个未经验证容错事务,避免了因父子事务依赖关系而导致的处理器忙等待,提高了处理器的使用率。为支持未验证数据的共享,DoubleRun-MP还使用并修改了MOESI cache一致性协议,使其支持原始执行体与冗余执行体的冗余执行。此外我们还在第三章的理论基础上提出了写前读并行程序分段方法构造容错事务,避免系统检测到故障后回滚时产生的多米诺骨牌回滚效应,使用Lamport时钟对容错事务进行全局排序以支持其新状态按逻辑顺序向下持久化。提出了访存窗口的概念,并设计了指令年龄表,通过限制写操作打破访存窗口确保了原始执行体与冗余执行体的输入一致性,保证了并行程序的执行语义正确性。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP302.8;TP332

【相似文献】

相关期刊论文 前10条

1 沈绪榜;嵌入式MPP处理器的发展[J];电子产品世界;2005年21期

2 于永斌;徐洁;吴晓华;王华;丁旭阳;;多核时代的“计算机系统结构”课程[J];计算机教育;2011年06期

3 罗沛霖;罗晋;凯睿;Steve Novack;Victor Berman;;混合式可重构数字多核并行处理器平台[J];前沿科学;2008年04期

4 ;通过FLIX指令结构提高可配置处理器计算性能[J];电子设计技术;2006年02期

5 许珊琳;;ARM公司的多处理技术[J];中国集成电路;2006年05期

6 ;龙芯2号增强型处理器Loongson2E[J];中国集成电路;2008年02期

7 王莹;;Wind River为Altera软核NiosII提供Linux支持[J];电子产品世界;2009年04期

8 郭从征;王沁;;低速率声码器芯片设计[J];河北工业大学成人教育学院学报;2005年04期

9 赵德斌,陈耀强,胡良校;Feig快速DCT算法及其处理器的体系结构设计[J];计算机研究与发展;1998年12期

10 Peter Coffee;;快不是唯一标准[J];每周电脑报;1999年44期

相关会议论文 前10条

1 彭林;张小强;刘德峰;谢伦国;田祖伟;;一种挖掘多核处理器存储级并行的算法[A];第15届全国信息存储技术学术会议论文集[C];2008年

2 陈虎;欧彦麟;陈海波;;面向多核处理器平台的并行Hash JOIN算法设计与实现[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

3 陈虎;罗伟良;干芸芸;;Multi_MINT:一个基于MINT的多核处理器模拟器[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

4 何军;王飙;;通用多核处理器发展现状和趋势研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

5 周巍;孙冰;战立明;吕建华;王国仁;于戈;;基于DOM模型的XML查询处理器的设计与实现[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

6 王海鹏;倪远平;;U-boot在mini2440平台上的移植方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年

7 胡杏;胡瑜;李晓维;;基于存储级并行的同时多线程电压紧急容错技术[A];第十四届全国容错计算学术会议(CFTC'2011)论文集[C];2011年

8 王庆;季振洲;刘涛;;面向嵌入式多核存储层次的OpenMP优化研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年

9 李勇;刘胜;甄体智;;C64x+DSP内核分析及其性能评价[A];第15届全国信息存储技术学术会议论文集[C];2008年

10 刘滔;毛宇光;徐洁磐;;CBase查询执行引擎的设计与实现[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

相关重要报纸文章 前10条

1 本报记者 温庆生 特约记者 王握文;“算盘王国”新传奇[N];光明日报;2010年

2 学健 编译;Linux:一种趋势[N];计算机世界;2001年

3 心元;PC“心脏”的搏击[N];计算机世界;2004年

4 本报记者 汤铭;“天河一号” 跃居世界榜首[N];计算机世界;2010年

5 ;Microsoft Embeded OS缩小的桌面系统[N];中国计算机报;2001年

6 本报记者 薛仁 王握文 特约通讯员 司宏伟;超越之路[N];解放军报;2010年

7 本报记者 张群英;10年布局IBM豪赌“一种服务器”[N];网络世界;2002年

8 ;HP为Itanium提供Linux开发工具包[N];计算机世界;2000年

9 米笑;安全实现接入端业务汇聚[N];中国计算机报;2004年

10 井之;新一代安腾处理器[N];网络世界;2002年

相关博士学位论文 前10条

1 徐光;分片式流处理器体系结构[D];中国科学技术大学;2010年

2 孙涛;面向动态异构众核处理器的任务调度研究[D];中国科学技术大学;2013年

3 刘德峰;面向存储级并行的多核处理器关键技术研究[D];国防科学技术大学;2011年

4 李静梅;多核处理器的设计技术研究[D];哈尔滨工程大学;2010年

5 朱海涛;面向高密度计算的多核处理器结构研究[D];中国科学技术大学;2011年

6 刘谷;可重构众核流处理器上的编译与程序优化技术[D];中国科学技术大学;2013年

7 陈虎;面向应用的指令集处理器关键技术研究[D];国防科学技术大学;2011年

8 刘光辉;高效处理器容错技术研究与实现[D];国防科学技术大学;2013年

9 黄立波;片上集群体系结构关键技术研究[D];国防科学技术大学;2010年

10 张惠臻;可重构指令集处理器设计中的软件重定向关键技术研究[D];中国科学技术大学;2010年

相关硕士学位论文 前10条

1 赵丽丽;基于TTA内核的流处理器设计的研究[D];上海交通大学;2010年

2 董珍;异构多核处理器的任务调度分配问题及算法研究[D];哈尔滨工程大学;2010年

3 尤凯迪;高性能低功耗多核处理器研究[D];复旦大学;2011年

4 钟松延;可配置可扩展处理器编译器设计[D];天津大学;2012年

5 刘子扬;基于虚拟计算群的众核处理器动态在线任务调度算法研究[D];上海交通大学;2013年

6 盛肖炜;多核处理器内部核间通信研究[D];沈阳理工大学;2013年

7 董正杨;乱序处理器指令吞吐量平稳化的动态调节方法研究[D];华中科技大学;2012年

8 闵银皮;同构通用流多核处理器存储部件关键技术研究[D];国防科学技术大学;2012年

9 叶新栋;一种Java处理器的体系结构设计与研究[D];复旦大学;2011年

10 马媛;基于多核处理器平台的分流模块的设计与实现[D];北京交通大学;2012年



本文编号:2544088

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2544088.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ef3b4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com