支持Gather/Scatter的向量存储器的设计与实现
发布时间:2021-08-14 15:40
随着数字信号处理器(DSP)应用的不断扩展,如何提高DSP的运算性能面临着新的挑战。SIMD架构能充分发掘应用的数据级并行,以较低的硬件开销和功耗预算实现较高的峰值运算性能,已成为高性能DSP的主流。SIMD架构DSP通常能高效支持地址连续或等距跨步等规则数据的向量访存,但对广泛存在于科学计算和工程应用中的不规则数据访存却不能很好的支持。不规则访存使得SIMD DSP访存带宽效率下降,降低了处理器整体运算性能,Gather/Scatter访存技术则能有效缓解这一问题。V-DSP是课题组自主研发的高性能向量DSP内核,本文根据该DSP向量访存的需求,在支持其双向量Load/Store的基础上,设计了支持Gather/Scatter的向量存储器(GSVM),实现了不规则数据的向量访存,有效扩展了向量访存的适应范围,提高了带宽效率。本文的主要工作和创新点体现在以下几个方面:1、在分析不规则数据访存特点的基础上,提出了一种SIMD结构的冲突缓冲器阵列设计,以缓存仲裁失败的向量访问请求、保证向量访存的流水执行;搭建GatherS/Scatter访存分布模型和访存冲突量化模型,给出不同SIMD宽度...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
向量存储器的Block覆盖率
第 54 页图4.14 向量存储器的Block覆盖率图4.15 向量存储器的表达式覆盖率4.3 逻辑综合逻辑综合(logic synthesis)是芯片设计流程中的重要环节之一,图 4.16 所示是 ASIC 前端设计的一般流程,在完成 RTL 设计描述,开始验证模拟的同时开始对设计进行逻辑综合。逻辑综合的一般过程包括翻译、逻辑优化和映射三个过程,对于复杂的电路设计,往往需要对代码修改、功能验证和逻辑综合过程进行反复迭代才能满足设计规范的要求[63]。综合时首先要对综合工具设置适当的约束条件,综合工具根据这些约束条件和相关芯片制造商提供的标准单元库文件,对 HDL 源码进行翻译解析
【参考文献】:
博士论文
[1]向量SIMD DSP上高效矩阵运算技术研究[D]. 张凯.国防科学技术大学 2013
[2]针对不规则应用的图形处理器资源调度关键技术研究[D]. 穆帅.清华大学 2013
硕士论文
[1]32位高性能DSP SIMD向量存储器的设计和验证[D]. 徐沛文.国防科学技术大学 2015
本文编号:3342732
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
向量存储器的Block覆盖率
第 54 页图4.14 向量存储器的Block覆盖率图4.15 向量存储器的表达式覆盖率4.3 逻辑综合逻辑综合(logic synthesis)是芯片设计流程中的重要环节之一,图 4.16 所示是 ASIC 前端设计的一般流程,在完成 RTL 设计描述,开始验证模拟的同时开始对设计进行逻辑综合。逻辑综合的一般过程包括翻译、逻辑优化和映射三个过程,对于复杂的电路设计,往往需要对代码修改、功能验证和逻辑综合过程进行反复迭代才能满足设计规范的要求[63]。综合时首先要对综合工具设置适当的约束条件,综合工具根据这些约束条件和相关芯片制造商提供的标准单元库文件,对 HDL 源码进行翻译解析
【参考文献】:
博士论文
[1]向量SIMD DSP上高效矩阵运算技术研究[D]. 张凯.国防科学技术大学 2013
[2]针对不规则应用的图形处理器资源调度关键技术研究[D]. 穆帅.清华大学 2013
硕士论文
[1]32位高性能DSP SIMD向量存储器的设计和验证[D]. 徐沛文.国防科学技术大学 2015
本文编号:3342732
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3342732.html