基于深度学习算法的向量处理IP核设计

发布时间：2022-10-22 21:07

　　随着万物互联时代的到来,各个领域内的数据量爆炸式增长。深度学习算法能够帮助各个领域的人员从海量数据中挖掘出用户的需求,提取有价值的信息。随着深度学习算法的不断更新,深度学习的应用在各个场景中的准确度越来越高。但这也增加了神经网络计算的数据量和复杂度。速度瓶颈、功耗问题以及对大规模计算平台的依赖已经成为了深度学习应用发展不可忽视的阻碍。针对以上问题,围绕主流的深度学习芯片发展趋势,以现阶段应用范围最为广泛的卷积神经CNN网络为核心,对CNN网络中的卷积层、池化层、批量归一化层、激活函数层、全连接层的内部计算原理进行研究学习,发现大多数算术运算都可以聚合为向量运算,而且经常需要对这些排列整齐的数据进行密集的、连续的和可变长度的访问。以此为出发点,利用神经网络运算中潜在的数据级并行性和数据局部性的计算特点,选择对现阶段应用效果最好的卷积神经网络算法进行ASIC硬件实现。在本文中设计了向量处理IP核ME,它是深度学习加速器中计算单元的一部分,用来完成除卷积运算外其它向量运算功能。在本文中还定义了向量处理IP核ME模块的指令集,并根据需要完成的功能把ME模块划分为访存控制模块MD和计算控制模块M...

【文章页数】：69 页

【学位级别】：硕士

【文章目录】：
致谢
摘要
ABSTRACT
1 引言
    1.1 研究背景及意义
    1.2 国内外深度学习计算平台研究现状
        1.2.1 GPU
        1.2.2 FPGA
        1.2.3 ASIC
    1.3 论文的研究内容
    1.4 论文的组织结构
    1.5 本章小结
2 深度学习与卷积神经网络
    2.1 深度学习概述
    2.2 卷积神经网络
        2.2.1 卷积层
        2.2.2 池化层
        2.2.3 批量规范化层
        2.2.4 激活函数层
        2.2.5 全连接层
    2.3 本章小结
3 向量处理IP核ME设计
    3.1 矩阵运算加速
    3.2 ME整体框架设计及模块划分
    3.3 访存控制MD模块设计
        3.3.1 地址生成单元设计
        3.3.2 译码器设计
    3.4 FIFO模块设计
        3.4.1 读数据相关设计
        3.4.2 写数据相关设计
    3.5 计算控制MC模块设计
        3.5.1 池化模块设计
        3.5.2 分段线性函数模块设计
        3.5.3 向量除法模块设计
        3.5.4 向量ALU模块设计
        3.5.5 向量乘法模块设计
        3.5.6 批量归一化模块设计
    3.6 ME指令编码及寄存器定义
        3.6.1 ME指令编码
        3.6.2 ME寄存器定义
    3.7 本章小结
4 仿真与综合
    4.1 功能仿真
        4.1.1 MXP模块功能仿真
        4.1.2 AVEP模块功能仿真
        4.1.3 PWL模块功能仿真
        4.1.4 ADD模块功能仿真
        4.1.5 BN模块功能仿真
    4.2 逻辑综合
    4.3 本章小结
5 验证与性能分析
    5.1 搭建深度学习加速器
        5.1.1 主控制器
        5.1.2 DMA模块
        5.1.3 内部存储SRAM生成及配置
        5.1.4 计算模块
        5.1.5 DDR生成及配置
        5.1.6 AXI总线生成及配置
    5.2 实验平台介绍
    5.3 实验流程
    5.4 性能分析
    5.5 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集

【参考文献】：
期刊论文
[1]基于卷积神经网络的图片验证码识别[J]. 张涛,张乐乐.  电子测量技术. 2018(14)
[2]基于深度神经网络的关键词识别系统[J]. 孙彦楠,夏秀渝.  计算机系统应用. 2018(05)
[3]采用卷积神经网络的小幅文本图像重聚焦算法[J]. 王康康,王柯俨,李云松.  西安电子科技大学学报. 2018(04)
[4]应用深度卷积神经网络的色织物缺陷检测[J]. 景军锋,范晓婷,李鹏飞,洪良.  纺织学报. 2017(02)
[5]基于FPGA的卷积神经网络加速器[J]. 余子健,马德,严晓浪,沈君成.  计算机工程. 2017(01)
[6]Synopsys推出快速原型系统HAPS-60系列[J]. 本刊通讯员.  电子与封装. 2010(06)

硕士论文
[1]基于可重构SoC平台的神经网络加速器设计[D]. 李宏炜.南京大学 2018
[2]基于FPGA的深度学习加速器设计与实现[D]. 余奇.中国科学技术大学 2016
[3]深度学习算法可重构加速器关键技术研究[D]. 刘志强.国防科学技术大学 2014
[4]基于FPGA的永磁同步电机神经网络解耦控制设计与实现[D]. 董立威.电子科技大学 2014

本文编号：3696871

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/3696871.html

上一篇：高功率高光束质量半导体碟片激光器的研究
下一篇：类脑计算的基础元件:从忆阻元到分忆抗元

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|