快速故障检测在硅后验证中的优化技术研究
发布时间:2020-11-02 03:02
半导体硅基芯片是当今每一个电子设备运行的必备基础,已经广泛融入日常生活。从芯片设计的角度出发,为确保芯片的可靠性和安全性,芯片在大规模生产之前需要进行严格地验证和调试。硅后验证是芯片验证中的一道工艺,支配了芯片设计总体时间成本。硅后验证应用于原型硅上,存在验证周期长的限制;摩尔定律和Dennard Scaling表明现代芯片越来越复杂,尤其是面向多核处理器的片上系统芯片,这为硅后验证提出了更高的挑战;同时,芯片的更新迭代速率不断加快。因此,如何快速、高效地进行硅后验证是芯片验证领域亟待解决的难题。本文针对超长的硅后验证故障检测延迟问题展开研究,主要完成以下三个方面的工作:首先,提出了一个基于LLVM(Low level virtual machine)的快速故障检测优化模型。通过分析芯片验证流程,本文发现超长的故障检测延迟是硅后验证的瓶颈,限制了硅后验证的效率。借助于容错计算中的故障检测算法,本文提出了一个基于这些算法的快速故障检测优化模型,该模型基于LLVM编译器框架,具有易扩展的特点,可适用于多种不同架构的芯片。该模型能够解决现有故障检测面临的系统化和自动化问题。其次,设计了故障延迟的检测框架。通过分析现有硅后验证的方法论,本文发现设置极端的物理环境激活芯片故障的方法在实验室环境下不可行。本文设计了一个基于gem5模拟器的故障延迟检测框架,该框架模拟现代硅基芯片已报告的故障类型,能够激活特定类型的故障,并在模拟器中测量故障被观测时的延迟。该框架能够对候选故障指令的选取和候选故障指令的故障注入实现容易的扩展。最后开展了大规模地实验测试。本文对基准测试程序集应用基于LLVM的故障检测优化模型,生成了大规模的待测试基准测试程序集合;然后在基于gem5模拟器的故障延迟检测框架中执行待测程序,测量故障检测延迟以及覆盖率。实验结果表明,本文提出的优化方案能够显著地将故障检测延迟降低至数千个时钟周期,故障覆盖率平均提升2倍,这为硅后验证中的故障定位提供了很大的便利。
【学位单位】:重庆大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TN43
【部分图文】:
基芯片在流片之前需要进行严格、充分地验证和调试它支配了芯片设计周期的主要时间成本。其中故障检瓶颈。为了高效地进行硅后验证,本文将对硅后验证化故障检测算法以及设计注入故障并检测故障的统一率进行优化。介绍硅后验证中故障检测的重要性以及面临的挑战究背景,其次介绍国内外研究现状,最后给出本文的们见证了移动设备爆发式地增长,例如智能手机、、汽车、机器人等等[1][2][3][4]。其中,硅芯片是它们的一个电子设备的运行,已经广泛融入我们的日常生活工业控制领域,硅芯片也是无处不在[5][6]。自主掌握硅经济和国防建设均具有十分重大的意义。
件下三种算法实验指标的不同,并展开分析。4.1.1 CFCSS 算法测试图4.1所示为十个基准测试程序在未应用CFCSS算法和应用了CFCSS算法的情形下在 gem5 模拟器中运行的行为汇总对比,每个程序分别在未应用 CFCSS 算法条件下执行 100 次和在应用了 CFCSS 算法条件下执行 100 次。对于图中每个基准测试程序,左边的柱状表示未应用 CFCSS 算法条件下基准测试程序在 gem5 模拟器中运行行为的占比,右边的柱状表示应用了 CFCSS 算法条件下基准测试程序在 gem5 模拟器运行行为的占比。每一种条件下基准测试程序的运行行为都与 3.5节列举的故障可观测类型相对应。以 998.spec 程序为例,在未应用 CFCSS 算法情形下,在 gem5 模拟器中运行行为由正常结束且结果不正确(Incorrect)、无限循环(Hung)和提前结束且无检测报告(Crash)构成,它们的占比分别为 40%、10%
图 4.1 基于 CFCSS 算法实现的故障检测覆盖率Fig.4.1 Fault detection coverage based on CFCSS algorithm故障检测覆盖率的计算方式是未检测出的不正确的结果,即图 4.1 中故障ncorrect、Hung 和 Crash 这三种类型之和。从图 4.1 我们可以发现,没有SS 算法条件下,未覆盖的故障达到了 100%,这是由于分支指令是故障敏在分支指令中的故障基本上都会造成程序运行的失败;应用了 CFCSS 算,未覆盖的故障缩减至 35%,由此发现,CFCSS 算法将故障的覆盖率提左右。
【参考文献】
本文编号:2866478
【学位单位】:重庆大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TN43
【部分图文】:
基芯片在流片之前需要进行严格、充分地验证和调试它支配了芯片设计周期的主要时间成本。其中故障检瓶颈。为了高效地进行硅后验证,本文将对硅后验证化故障检测算法以及设计注入故障并检测故障的统一率进行优化。介绍硅后验证中故障检测的重要性以及面临的挑战究背景,其次介绍国内外研究现状,最后给出本文的们见证了移动设备爆发式地增长,例如智能手机、、汽车、机器人等等[1][2][3][4]。其中,硅芯片是它们的一个电子设备的运行,已经广泛融入我们的日常生活工业控制领域,硅芯片也是无处不在[5][6]。自主掌握硅经济和国防建设均具有十分重大的意义。
件下三种算法实验指标的不同,并展开分析。4.1.1 CFCSS 算法测试图4.1所示为十个基准测试程序在未应用CFCSS算法和应用了CFCSS算法的情形下在 gem5 模拟器中运行的行为汇总对比,每个程序分别在未应用 CFCSS 算法条件下执行 100 次和在应用了 CFCSS 算法条件下执行 100 次。对于图中每个基准测试程序,左边的柱状表示未应用 CFCSS 算法条件下基准测试程序在 gem5 模拟器中运行行为的占比,右边的柱状表示应用了 CFCSS 算法条件下基准测试程序在 gem5 模拟器运行行为的占比。每一种条件下基准测试程序的运行行为都与 3.5节列举的故障可观测类型相对应。以 998.spec 程序为例,在未应用 CFCSS 算法情形下,在 gem5 模拟器中运行行为由正常结束且结果不正确(Incorrect)、无限循环(Hung)和提前结束且无检测报告(Crash)构成,它们的占比分别为 40%、10%
图 4.1 基于 CFCSS 算法实现的故障检测覆盖率Fig.4.1 Fault detection coverage based on CFCSS algorithm故障检测覆盖率的计算方式是未检测出的不正确的结果,即图 4.1 中故障ncorrect、Hung 和 Crash 这三种类型之和。从图 4.1 我们可以发现,没有SS 算法条件下,未覆盖的故障达到了 100%,这是由于分支指令是故障敏在分支指令中的故障基本上都会造成程序运行的失败;应用了 CFCSS 算,未覆盖的故障缩减至 35%,由此发现,CFCSS 算法将故障的覆盖率提左右。
【参考文献】
相关期刊论文 前2条
1 高建良;韩银和;;多核处理器硅后调试技术研究最新进展[J];计算机应用研究;2013年02期
2 李静梅;吴艳霞;沈晶;张健沛;;改进的CFCSS控制流检测算法[J];哈尔滨工程大学学报;2011年06期
本文编号:2866478
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2866478.html