一种基于FPGA的加速卷积计算的关键技术的研究与设计
发布时间:2021-07-10 05:29
随着互联网技术的发展,深度学习带来了人工智能的正循环,传统计算架构已经无法支撑大规模并行计算的需求。因此,需要通过加速底层应用的计算过程,来缩短深度学习算法的训练时间,从而推动人工智能整个产业链的发展。卷积神经网络(Convolutional Neural Network,CNN)是深度学习算法的一种重要网络模型,在手写识别、自然语言处理,医学图像分割等领域具有广泛的应用,也是机器学习、计算机图像视觉等学科研究的热点,因此具有一定的研究意义和价值。卷积神经网络需要对特征图中的所有区域进行综合评估,所以具有较大的计算复杂度。在其训练过程中,由于数据信息是由各个神经元分散存储和处理的,可以使卷积神经网络并行化,使得训练数据和训练参数能同时更新。为加速训练时的计算过程,减少算法的训练时间,可以考虑利用硬件和软件技术以并行代替传统串行计算方式实现卷积神经网络。因此,本文首先提出了一种简单的卷积神经网络模型------SpNet模型,并对卷积神经网络训练过程中不同类型的并行性进行了详细分析,针对其大量运用的卷积计算,从软件和硬件的角度,分别设计一种能加快卷积计算的方案。其中,软件方案为:首先把卷...
【文章来源】:云南大学云南省 211工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
CNN结构演化的历史开始-LeNet
LeNet架构
AlexNet架构
【参考文献】:
期刊论文
[1]一种基于可编程逻辑器件的卷积神经网络协处理器设计[J]. 杨一晨,张国和,梁峰,何平,吴斌,高震霆. 西安交通大学学报. 2018(07)
[2]基于FPGA的卷积神经网络的实现[J]. 李嘉辉,蔡述庭,陈学松,熊晓明. 自动化与信息工程. 2018(01)
[3]深度神经网络并行化研究综述[J]. 朱虎明,李佩,焦李成,杨淑媛,侯彪. 计算机学报. 2018(08)
[4]基于深度卷积网络的图像分类算法研究[J]. 邹铁. 安徽电子信息职业技术学院学报. 2017(06)
[5]互学习神经网络训练方法研究[J]. 刘威,刘尚,白润才,周璇,周定宁. 计算机学报. 2017(06)
[6]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[7]高光谱图像处理与信息提取前沿[J]. 张兵. 遥感学报. 2016(05)
[8]基于FPGA的卷积神经网络加速器[J]. 余子健,马德,严晓浪,沈君成. 计算机工程. 2017(01)
[9]GPU矩阵乘法的性能定量分析模型[J]. 尹孟嘉,许先斌,熊曾刚,张涛. 计算机科学. 2015(12)
[10]卷积神经网络的FPGA并行结构研究[J]. 杨薇. 数字技术与应用. 2015(12)
博士论文
[1]基于FPGA的卷积神经网络并行结构研究[D]. 陆志坚.哈尔滨工程大学 2013
硕士论文
[1]深度学习的硬件实现与优化技术研究[D]. 林楗军.哈尔滨工业大学 2017
[2]基于FPGA的卷积神经网络系统的设计与实现[D]. 李泽坤.哈尔滨工业大学 2017
[3]基于GPU的深度学习算法并行化研究[D]. 晋雅茹.东南大学 2017
[4]基于分布式深度学习系统的视频动作识别[D]. 杨志刚.中国科学技术大学 2017
[5]基于FPGA的卷积神经网络加速器设计[D]. 王思阳.电子科技大学 2017
[6]面向性能异构的卷积神经网络并行优化研究[D]. 肖俊峰.杭州电子科技大学 2017
[7]基于GPU的深度神经网络模型并行及优化方法研究[D]. 张函.华中科技大学 2016
[8]基于FPGA的深度学习加速器设计与实现[D]. 余奇.中国科学技术大学 2016
[9]基于FPGA的卷积神经网络应用研究[D]. 王羽.华南理工大学 2016
[10]基于FPGA配置的电路系统设计[D]. 康嘉.西安电子科技大学 2014
本文编号:3275283
【文章来源】:云南大学云南省 211工程院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
CNN结构演化的历史开始-LeNet
LeNet架构
AlexNet架构
【参考文献】:
期刊论文
[1]一种基于可编程逻辑器件的卷积神经网络协处理器设计[J]. 杨一晨,张国和,梁峰,何平,吴斌,高震霆. 西安交通大学学报. 2018(07)
[2]基于FPGA的卷积神经网络的实现[J]. 李嘉辉,蔡述庭,陈学松,熊晓明. 自动化与信息工程. 2018(01)
[3]深度神经网络并行化研究综述[J]. 朱虎明,李佩,焦李成,杨淑媛,侯彪. 计算机学报. 2018(08)
[4]基于深度卷积网络的图像分类算法研究[J]. 邹铁. 安徽电子信息职业技术学院学报. 2017(06)
[5]互学习神经网络训练方法研究[J]. 刘威,刘尚,白润才,周璇,周定宁. 计算机学报. 2017(06)
[6]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[7]高光谱图像处理与信息提取前沿[J]. 张兵. 遥感学报. 2016(05)
[8]基于FPGA的卷积神经网络加速器[J]. 余子健,马德,严晓浪,沈君成. 计算机工程. 2017(01)
[9]GPU矩阵乘法的性能定量分析模型[J]. 尹孟嘉,许先斌,熊曾刚,张涛. 计算机科学. 2015(12)
[10]卷积神经网络的FPGA并行结构研究[J]. 杨薇. 数字技术与应用. 2015(12)
博士论文
[1]基于FPGA的卷积神经网络并行结构研究[D]. 陆志坚.哈尔滨工程大学 2013
硕士论文
[1]深度学习的硬件实现与优化技术研究[D]. 林楗军.哈尔滨工业大学 2017
[2]基于FPGA的卷积神经网络系统的设计与实现[D]. 李泽坤.哈尔滨工业大学 2017
[3]基于GPU的深度学习算法并行化研究[D]. 晋雅茹.东南大学 2017
[4]基于分布式深度学习系统的视频动作识别[D]. 杨志刚.中国科学技术大学 2017
[5]基于FPGA的卷积神经网络加速器设计[D]. 王思阳.电子科技大学 2017
[6]面向性能异构的卷积神经网络并行优化研究[D]. 肖俊峰.杭州电子科技大学 2017
[7]基于GPU的深度神经网络模型并行及优化方法研究[D]. 张函.华中科技大学 2016
[8]基于FPGA的深度学习加速器设计与实现[D]. 余奇.中国科学技术大学 2016
[9]基于FPGA的卷积神经网络应用研究[D]. 王羽.华南理工大学 2016
[10]基于FPGA配置的电路系统设计[D]. 康嘉.西安电子科技大学 2014
本文编号:3275283
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/3275283.html