基于近似计算与数据调度的CNN加速器设计与优化
发布时间:2021-12-18 08:33
卷积神经网络(Convolution Neural Network,CNN)在深度学习中占据重要位置,其网络结构具有较好的鲁棒性和容错能力,且易于进行网络训练和优化,由于存在乘加运算量大、访存密集、网络参数多样化等问题,在低功耗嵌入式领域,实现高能效的CNN加速器已成为研究热点。本文基于卷积神经网络的算法结构特征,通过研究并优化了基于近似计算与数据调度的架构设计,在满足不同应用场景与应用需求的情况下,尽可能降低CNN加速器的功耗。首先,通过对卷积神经网络的冗余性和容错性特征进行分析,对网络参数采用分层量化压缩的预处理方案,实现计算功耗与访存量降低的效果。然后,基于已预处理的权重数据,实现不同分层位宽的近似计算,解决了卷积运算乘法功耗大的问题;另一方面,基于卷积运算的数据重用轨迹研究,在运算阵列上提出多输出加法树路由互联结构,与阵列紧耦合的存储采用了乒乓缓存结构,对不同尺寸卷积运算,实现了高效灵活的映射方案;然后,通过基于大尺寸矩阵切割优化及调节阵列供给电压,解决了存储和计算阵列之间的数据不平衡问题,从而实现高能效的CNN加速器数据调度设计。在TSMC 45nm工艺下,针对不同的卷积神经...
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
迭代对数乘法器仿真波形
计算阵列的功能仿真波形图
【参考文献】:
期刊论文
[1]超越隐主题包模型:针对场景类别识别的空间金字塔匹配(英文)[J]. Fu-xiang LU,Jun HUANG. Frontiers of Information Technology & Electronic Engineering. 2015(10)
硕士论文
[1]基于FPGA的深度学习加速器设计与实现[D]. 余奇.中国科学技术大学 2016
本文编号:3542025
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
迭代对数乘法器仿真波形
计算阵列的功能仿真波形图
【参考文献】:
期刊论文
[1]超越隐主题包模型:针对场景类别识别的空间金字塔匹配(英文)[J]. Fu-xiang LU,Jun HUANG. Frontiers of Information Technology & Electronic Engineering. 2015(10)
硕士论文
[1]基于FPGA的深度学习加速器设计与实现[D]. 余奇.中国科学技术大学 2016
本文编号:3542025
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3542025.html