基于FPGA的CNN自动代码生成设计与实现
发布时间:2021-07-06 05:14
卷积神经网络(CNN)是一种非常重要的深度学习算法,由于通过它得到的结果识别效率高,因而得到了广泛的重视,成为众多科学领域的研究热点之一。除此之外,它在很多领域应用广泛,例如物体检测,图像识别等领域。目前,以应用为目标的深度学习相关算法发展迅速,这大大拓展了其应用的研究领域。一般来说,深度学习技术包括两个过程:数据训练和数据推断,而这两个过程对硬件资源的需求不同。GPU适用于数据训练阶段,而数据推断阶段则需要在移动设备上,尤其是FPGA。鉴于FPGA具有高性能、灵活、发展周期快速等优点,各种基于FPGA平台的深度卷积神经网络加速器相继被提出。虽然FPGA加速器已经表现出比通用处理器更好的性能,但是在移动设备上加速器设计的难度却并未被降低,尤其是在ARM+FPGA开发板上实现非常困难。现有CNN加速器在设计构造过程中,需要设计人员对CNN各个模块进行描述,传统的方式是通过编写代码或者利用高层次综合技术。显而易见,编写代码过程不仅难度大,而且还可能因为人为因素在编写代码时产生不必要的错误,从而导致开发周期长。这一关键问题得不到解决,就会导致加速器的设计难度加大。本文为了克服上述困难,设计和...
【文章来源】:天津工业大学天津市
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图1-1?GM204硬件架构图M??以GM204硬件图为例,GPU主要由主机接口(host?interface)、复制引擎??(copy?engine)、流处理器簇(Streaming?Multiprocessors)、图形处理簇??
图2-4卷积神经网络发展历程??上图是卷积神经网络结构演化的进程,从神经认知机模型开始,这时就生了卷积结构,卷积神经网络发展历程基本可以分为三个发展阶段,分别阶段、实现阶段和应用阶段。??(1)理论阶段。上世纪80年代,Neocognitrorr_'___']由Fukushima等人提出层的多层ANN。它己被用于手写字符识别和其他模式识别任务,并作为卷网络的灵感。Neocognitron受到了?Hubel&Wiesel于1959年提出的模型。
?FastER??V2?ri?in?rn?r-cnn??图2-4卷积神经网络发展历程??上图是卷积神经网络结构演化的进程,从神经认知机模型开始,这时就已经??诞生了卷积结构,卷积神经网络发展历程基本可以分为三个发展阶段,分别为理??论阶段、实现阶段和应用阶段。??(1)
【参考文献】:
期刊论文
[1]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[2]基于FPGA的存储优化的细粒度并行Zuker算法加速器研究[J]. 夏飞,窦勇,徐佳庆,张阳. 计算机研究与发展. 2011(04)
硕士论文
[1]基于自动代码生成技术的硬件NOC仿真器的设计与实现[D]. 龚丹丹.天津工业大学 2017
[2]OpenCL与FPGA异构模式的颜色识别应用研究[D]. 唐文龙.湖北大学 2016
[3]基于FPGA的实时动态侦测系统的软硬件协同设计[D]. 杨磊.电子科技大学 2015
[4]基于OpenCL并行加速算法研究及其FPGA实现[D]. 彭新显.武汉工程大学 2014
[5]基于Silverlight的WebGIS研究与实践[D]. 王若一.辽宁工程技术大学 2011
[6]基于FPGA的视频图像处理系统[D]. 杨宁.大连海事大学 2008
[7]基于nML的指令集仿真器自动生成技术初步研究[D]. 刘竞楠.华北电力大学(北京) 2008
本文编号:3267603
【文章来源】:天津工业大学天津市
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图1-1?GM204硬件架构图M??以GM204硬件图为例,GPU主要由主机接口(host?interface)、复制引擎??(copy?engine)、流处理器簇(Streaming?Multiprocessors)、图形处理簇??
图2-4卷积神经网络发展历程??上图是卷积神经网络结构演化的进程,从神经认知机模型开始,这时就生了卷积结构,卷积神经网络发展历程基本可以分为三个发展阶段,分别阶段、实现阶段和应用阶段。??(1)理论阶段。上世纪80年代,Neocognitrorr_'___']由Fukushima等人提出层的多层ANN。它己被用于手写字符识别和其他模式识别任务,并作为卷网络的灵感。Neocognitron受到了?Hubel&Wiesel于1959年提出的模型。
?FastER??V2?ri?in?rn?r-cnn??图2-4卷积神经网络发展历程??上图是卷积神经网络结构演化的进程,从神经认知机模型开始,这时就已经??诞生了卷积结构,卷积神经网络发展历程基本可以分为三个发展阶段,分别为理??论阶段、实现阶段和应用阶段。??(1)
【参考文献】:
期刊论文
[1]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航. 计算机应用. 2016(09)
[2]基于FPGA的存储优化的细粒度并行Zuker算法加速器研究[J]. 夏飞,窦勇,徐佳庆,张阳. 计算机研究与发展. 2011(04)
硕士论文
[1]基于自动代码生成技术的硬件NOC仿真器的设计与实现[D]. 龚丹丹.天津工业大学 2017
[2]OpenCL与FPGA异构模式的颜色识别应用研究[D]. 唐文龙.湖北大学 2016
[3]基于FPGA的实时动态侦测系统的软硬件协同设计[D]. 杨磊.电子科技大学 2015
[4]基于OpenCL并行加速算法研究及其FPGA实现[D]. 彭新显.武汉工程大学 2014
[5]基于Silverlight的WebGIS研究与实践[D]. 王若一.辽宁工程技术大学 2011
[6]基于FPGA的视频图像处理系统[D]. 杨宁.大连海事大学 2008
[7]基于nML的指令集仿真器自动生成技术初步研究[D]. 刘竞楠.华北电力大学(北京) 2008
本文编号:3267603
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/3267603.html