当前位置:主页 > 科技论文 > 计算机论文 >

基于GPGPU平台的软错误检测模型研究

发布时间:2022-10-30 13:38
  GPGPUs(general-purpose Graphics Processing Units)因为其高并发性和高吞吐量的优势,已经成为多种科学领域不可或缺的计算单元。如此高的计算能力归功于GPUs芯片上成百上千个高度集成的计算内核。内核是独立的计算单元,计算任务被分发在这些单元上进行并行计算从而提高计算性能。芯片晶体管体积的不断缩小以及集成度的不断提高,使得高度集成的GPGPU平台更容易受到高能粒子的撞击而导致逻辑单元发生比特位翻转的故障,这种故障也被称为软错误。发生在底层芯片的软错误很容易对运行在上层的应用造成影响,其中静默数据损坏(Silent Data Corruption,SDC)由于会影响输出的准确性并且在运行过程中不会产生异常的信息,无法通过基于症状的检测机制所捕获。为了保证GPGPU应用的可靠执行,针对SDC错误提出有效的检测机制至关重要。指令全冗余技术是检测SDC错误的最有效、直观的手段,它通过比较副本指令和原始指令的运算结果来检测错误。但是由于指令的冗余执行,该技术会产生过多的空间和计算开销,严重影响GPGPU平台的并行处理性能。针对指令全冗余技术开销过高的问题,... 

【文章页数】:58 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题研究背景和意义
    1.2 课题研究现状
    1.3 本文工作
    1.4 本文结构
第2章 相关背景介绍
    2.1 GPU编程模型
        2.1.1 GPU架构
        2.1.2 CUDA编程模型
        2.1.3 CUDA编译模型
    2.2 软错误定义
        2.2.1 软错误产生机制
        2.2.2 软错误的影响
        2.2.3 软错误的严重性
    2.3 软错误检测
        2.3.1 基于硬件的检测
        2.3.2 基于软件的检测
    2.4 本章小结
第3章 面向软错误的检测设计
    3.1 问题背景
    3.2 故障模型
        3.2.1 输出质量度量
        3.2.2 故障模型实现
        3.2.3 故障结果分类
    3.3 SDC错误检测总体设计
    3.4 本章小结
第4章 指令SDC倾向性预测模型
    4.1 相关定义
    4.2 预测模型
    4.3 指令SDC倾向性特征提取
        4.3.1 指令属性特征
        4.3.2 指令依赖特征
    4.4 基于SVM的预测模型构建
    4.5 本章小结
第5章 实验和结果分析
    5.1 实验设计
    5.2 实验结果与分析
        5.2.1 参数设定
        5.2.2 SDC倾向性预测分析
        5.2.3 SDC错误检测验证
    5.3 本章小结
第6章 总结与展望
    6.1 工作总结
    6.2 工作展望
参考文献
作者简介及在学期间所取得的科研成果
致谢


【参考文献】:
期刊论文
[1]基于机器学习的指令SDC脆弱性分析方法[J]. 张倩雯,庄毅.  小型微型计算机系统. 2018(04)
[2]一种基于不变量的软错误检测方法[J]. 马骏驰,汪芸.  软件学报. 2016(02)

硕士论文
[1]基于动态可重构技术的FPGA中SEU故障容错方法研究[D]. 费亚男.哈尔滨工业大学 2013



本文编号:3698987

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3698987.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户021e6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com