基于FPGA的卷积神经网络加速器研究
发布时间:2020-05-21 01:34
【摘要】:卷积神经网络广泛应用于图像识别、语音识别、人脸识别和语义分析等领域。其网络结构复杂,隐含层众多,每层包含大量的乘累加运算,是一种计算密集型和资源占用密集型的网络。FPGA比GPU功耗低,比ASIC灵活性高,是一种兼顾性能和功耗的硬件加速平台。本文针对于卷积神经网络计算量大,功耗大的问题,基于FPGA平台对卷积神经网络加速计算进行了研究。首先通过对卷积神经网络前向计算和反向传播过程的研究,分析卷积神经网络的卷积层,采样层和全连接层的计算过程。然后研究前向计算过程中的并行性,包括卷积窗口内部并行,同一特征映射上卷积窗口间并行和不同特征映射上卷积窗口间并行。经过分析卷积层、采样层和全连接层的计算结构的相似性后,提出将全连接层计算和平均采样计算转化为卷积层计算的方法,设计了一个包含卷积加速模块和采样加速模块的通用计算单元,网络的每一层复用此通用计算单元完成整个网络的计算。本文研究的加速器的架构是主机+控制器+FPGA通用计算单元,对卷积神经网络的前向计算过程进行加速,主机将图片发给控制器,控制器调用加速单元计算并返回结果。实验采用CIFAR-10数据集进行验证,将相同的网络结构分别在CPU和FPGA平台上计算,比较结果表明同等网络结构下,FPGA并行加速计算比CPU计算速度快,功耗低。
【图文】:
- 42 -图 4-3 并行组合和流水线示意Fig. 4-3 Combination structures of computational parallel and pipeline
4-4 同一个特征映射上卷积窗口内部并行和卷积窗口间并行的组合的计算结构仿Fig. 4-4 Simulation of the computational structure of the parallel combination图 4-5 采样模块的实现Fig. 4-5 Implementation of pooling
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TN791;TP183
【图文】:
- 42 -图 4-3 并行组合和流水线示意Fig. 4-3 Combination structures of computational parallel and pipeline
4-4 同一个特征映射上卷积窗口内部并行和卷积窗口间并行的组合的计算结构仿Fig. 4-4 Simulation of the computational structure of the parallel combination图 4-5 采样模块的实现Fig. 4-5 Implementation of pooling
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TN791;TP183
【相似文献】
相关期刊论文 前10条
1 胡悦;;金融市场中的神经网络拐点预测法[J];金融经济;2017年18期
2 陈晓燕;;浅析简单神经网络的发展及简单模型[J];数字技术与应用;2019年05期
3 迟惠生;陈珂;;1995年世界神经网络大会述评[J];国际学术动态;1996年01期
4 吴立可;;脉冲神经网络和行为识别[J];通讯世界;2018年12期
5 林嘉应;郑柏伦;刘捷;;基于卷积神经网络的船舶分类模型[J];信息技术与信息化;2019年02期
6 俞颂华;;卷积神经网络的发展与应用综述[J];信息通信;2019年02期
7 韩真;凯文·哈特尼特;;为神经网络的通用理论建造基石[J];世界科学;2019年04期
8 鲍伟强;陈娟;熊涛;;基于进化神经网络的短期电力负荷预测研究[J];电工技术;2019年11期
9 王丽华;杨秀萍;王皓;高峥翔;;智能双轮平衡车的设计研究[J];数字技术与应用;2018年04期
10 张庭略;;基于硬件的神经网络加速[J];通讯世界;2018年08期
相关会议论文 前10条
1 孙军田;张U,
本文编号:2673524
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2673524.html