基于FPGA的卷积神经网络加速器研究

发布时间：2020-05-21 01:34

【摘要】：卷积神经网络广泛应用于图像识别、语音识别、人脸识别和语义分析等领域。其网络结构复杂,隐含层众多,每层包含大量的乘累加运算,是一种计算密集型和资源占用密集型的网络。FPGA比GPU功耗低,比ASIC灵活性高,是一种兼顾性能和功耗的硬件加速平台。本文针对于卷积神经网络计算量大,功耗大的问题,基于FPGA平台对卷积神经网络加速计算进行了研究。首先通过对卷积神经网络前向计算和反向传播过程的研究,分析卷积神经网络的卷积层,采样层和全连接层的计算过程。然后研究前向计算过程中的并行性,包括卷积窗口内部并行,同一特征映射上卷积窗口间并行和不同特征映射上卷积窗口间并行。经过分析卷积层、采样层和全连接层的计算结构的相似性后,提出将全连接层计算和平均采样计算转化为卷积层计算的方法,设计了一个包含卷积加速模块和采样加速模块的通用计算单元,网络的每一层复用此通用计算单元完成整个网络的计算。本文研究的加速器的架构是主机+控制器+FPGA通用计算单元,对卷积神经网络的前向计算过程进行加速,主机将图片发给控制器,控制器调用加速单元计算并返回结果。实验采用CIFAR-10数据集进行验证,将相同的网络结构分别在CPU和FPGA平台上计算,比较结果表明同等网络结构下,FPGA并行加速计算比CPU计算速度快,功耗低。
【图文】：

并行组合,流水线

- 42 -图 4-3 并行组合和流水线示意Fig. 4-3 Combination structures of computational parallel and pipeline

特征映射,上卷,计算结构,卷积

4-4 同一个特征映射上卷积窗口内部并行和卷积窗口间并行的组合的计算结构仿Fig. 4-4 Simulation of the computational structure of the parallel combination图 4-5 采样模块的实现Fig. 4-5 Implementation of pooling
【学位授予单位】：哈尔滨理工大学
【学位级别】：硕士
【学位授予年份】：2019
【分类号】：TN791;TP183

【相似文献】