当前位置:主页 > 科技论文 > 计算机论文 >

基于RISC-V开源处理器的卷积神经网络加速器设计方法研究

发布时间:2020-08-28 06:30
【摘要】:近年来,随着深度学习的发展,卷积神经网络(Convolutional Neural Network,CNN)的硬件加速逐渐成为了研究的热门问题。可重构的加速器与通用CPU相结合的模式,既有通用性,又有针对具体问题情景的优化,成为一种高效地解决卷积神经网络加速问题的方案。但是,一方面商用CPU的专利授权费日益高昂,另一方面商用CPU与加速器各自的开发流程不兼容,有着开发流程复杂等问题,因此以RISC-V为代表的开源处理器+加速器的模式并结合全自动化设计方法,有助于更高效地进行CNN加速平台设计。为此,本文提出了一种基于RISC-V开源处理器的卷积神经网络加速结构及其硬件设计。本文首先通过对现有加速器结构,如加法树结构、脉动阵列结构、Eyeriss结构等进行分析,选取了综合性能较好的Eyeriss结构作为基础,之后在单个处理单元(Process Element,PE)内部、PE阵列的结构、PE阵列之间的并行、系统软硬件划分等四个层面进行研究。在单个PE层面,为了减少PE单元内部数据的移动,本文采用了维护循环数组指针的方式,提高了PE单元内部的运算效率。在PE阵列的层面,本文针对Eyeriss结构在卷积神经网络运行后期容易造成PE资源浪费的问题,提出了一种尺寸自适应的加速结构,有效提高了PE资源的利用率,进而对卷积神经网络起到了加速作用,此外也针对不同网络以及卷积层可能存在的Stride不同的情况进行了优化。在PE阵列之间并行的层面,本文利用输入输出混合并行的思想,分析了基于输入特征图和输出特征图的并行结构对带宽、缓存等的要求,最终在网络结构不改变的情况下设计了2×1×2的并行加速结构,在控制访存带宽的同时提高了加速效果。在系统软硬件划分方面,为了提高本文设计的灵活性,对系统的控制逻辑等进行了适当的划分,提高了系统对不同网络结构的适应性。本文在Rocket-Chip Emulator中对设计进行仿真,在Vivado软件中进行仿真和综合,测试结果表明:在使用本文结构的情况下前向流程的周期数缩减为串行的19.46%。相比普通Eyeriss结构,本文效果提高了22.3%。引入了输入输出特征图的并行结构后,一张图完成前向流程的周期数缩减为串行结构的11.6%,相比普通Eyeriss结构,本文效果提高了13.01%。实验结果验证了该结构在加速卷积神经网络方面的有效性,同时综合结果也说明硬件资源的消耗在可以接受的范围内。
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP332;TP183
【图文】:

基本指令,格式,扩展包,原子操作


图 2-1 RISC-V 基本指令的格式[23]Fig.2-1 RISC-V Base Instruction Formats[23]此外还有足够的操作码空间以支持自定义的扩展。这里面最规范和常用的扩展已经标准化了。现有的扩展包括乘法和除法、原子操作、单精度浮点数以及双

生成器,例子,实例


图 2-3 Rocket-Chip 生成器的结构[25]Fig.2-3 The Rocket-Chip Generator[25]个 Rocket Chip 实例的例子。它具有两个 Tile,连

生成器,例子,实例


图 2-3 Rocket-Chip 生成器的结构[25]Fig.2-3 The Rocket-Chip Generator[25]个 Rocket Chip 实例的例子。它具有两个 Tile,连

【参考文献】

相关期刊论文 前3条

1 方睿;刘加贺;薛志辉;杨广文;;卷积神经网络的FPGA并行加速方案设计[J];计算机工程与应用;2015年08期

2 施蕾;刘波;周凯;;基于SPARC V8结构处理器的计算机系统设计[J];空间控制技术与应用;2008年03期

3 G.Dan Hutcheson;黄国勇;;摩尔定律:一个改变历史和经济的推断[J];中国集成电路;2006年08期

相关博士学位论文 前1条

1 陆志坚;基于FPGA的卷积神经网络并行结构研究[D];哈尔滨工程大学;2013年

相关硕士学位论文 前6条

1 曾军;基于Openrisc的可重塑芯片设计[D];成都理工大学;2014年

2 徐金娜;基于leon3平台的软硬件协同验证环境的研究与设计[D];哈尔滨工业大学;2013年

3 唐建秋;OpenRISC处理器寄存器级仿真与实现[D];湖南大学;2013年

4 张勇;OpenSPARC~(TM)T1处理器的研究与实现[D];南开大学;2010年

5 童佳杰;AMBA2.0在MPEG-2 DECODER芯片中的实现及软硬件协同验证[D];北京工业大学;2009年

6 吴f[;OpenRISC处理器内的性能计数器的设计和实现[D];上海交通大学;2009年



本文编号:2807236

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2807236.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2662f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com