基于Xilinx Zynq平台的卷积神经网络模型研究
发布时间:2023-02-25 23:38
随着神经网络技术的迅猛发展,卷积神经网络正逐渐成为图像处理领域的首选算法,但卷积神经网络庞大的计算量使得其难以在各类移动应用场景中大规模推广使用。因此,利用适用于并行计算的FPGA来实现卷积神经网络已成为热点。但FPGA虽适合设计并行计算,却并不适合设计通用处理器可轻易实现的各类业务逻辑,因此很多应用采取的方案是同时使用FPGA和微处理器进行设计,这种设计的缺点是增加了开发成本,且不利于提升系统性能。为解决这一问题,Xilinx公司率先推出了Zynq系列平台,该平台是行业内首个将FPGA和微处理器集成进一个芯片中的平台,可轻松解决传统的双芯片设计带来的通信成本高、开发成本高等问题,适合需要进行高性能计算的移动应用场景。本研究基于Xilinx Zynq平台,设计了一种易于拓展的卷积神经网络计算模型。本文首先介绍了卷积神经网络和Xilinx Zynq平台,并对卷积神经网络在FPGA上实现硬件加速中的关键问题进行了分析。然后对本研究中基于Xilinx Zynq平台设计的卷积神经网络计算模型进行了详细的介绍,并针对计算模型的拓展给出了若干优化设计。最后,本文对本研究设计的计算模型进行了实验并对...
【文章页数】:93 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
缩略词表
第一章 绪论
1.1 研究工作的背景与意义
1.2 国内外研究现状
1.2.1 卷积神经网络发展现状
1.2.2 基于FPGA的卷积神经网络研究的发展现状
1.3 本论文的主要工作与安排
第二章 卷积神经网络与Xilinx Zynq平台介绍
2.1 卷积神经网络基本介绍
2.1.1 人工神经网络
2.1.2 卷积神经网络
2.2 Xilinx Zynq平台介绍
2.2.1 处理系统端
2.2.2 可编程逻辑端
2.2.3 处理系统端与可编程逻辑端的通信
2.3 本章小结
第三章 卷积神经网络的硬件加速设计
3.1 卷积层的硬件加速设计
3.2 批标准化的硬件加速设计
3.3 其他硬件加速相关设计
3.3.1 乒乓缓存机制
3.3.2 流水线机制
3.3.3 背压机制
3.4 本章小结
第四章 基于Zynq平台的卷积神经网络计算模型设计
4.1 计算模型总体架构
4.2 卷积神经网络计算模块设计
4.2.1 卷积神经网络计算模块总体设计
4.2.2 计算阵列区的设计
4.2.3 后处理区的设计
4.2.4 流计算区的设计
4.3 PL端其他模块的设计
4.3.1 DDR内存通信模块的设计
4.3.2 调试接口设计
4.3.3 处理系统端与可编程逻辑端的通信设计
4.4 PS端设计
4.5 性能优化设计
4.5.1 输入位宽与输出位宽不等的FIFO缓存设计
4.5.2 单路输入多路输出的乒乓缓存设计
4.5.3 基于单个块内存的乒乓缓存设计
4.5.4 支持流水线机制的背压机制
4.5.5 后处理区的多路优化设计
4.6 本章小结
第五章 计算模型验证与分析
5.1 Yolov2-tiny网络结构分析
5.2 正确性验证
5.2.1 验证方法设计
5.2.2 实验数据及分析
5.3 计算性能验证
5.3.1 验证方法设计
5.3.2 实验数据及分析
5.4 可拓展性分析
5.5 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的成果
本文编号:3749403
【文章页数】:93 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
缩略词表
第一章 绪论
1.1 研究工作的背景与意义
1.2 国内外研究现状
1.2.1 卷积神经网络发展现状
1.2.2 基于FPGA的卷积神经网络研究的发展现状
1.3 本论文的主要工作与安排
第二章 卷积神经网络与Xilinx Zynq平台介绍
2.1 卷积神经网络基本介绍
2.1.1 人工神经网络
2.1.2 卷积神经网络
2.2 Xilinx Zynq平台介绍
2.2.1 处理系统端
2.2.2 可编程逻辑端
2.2.3 处理系统端与可编程逻辑端的通信
2.3 本章小结
第三章 卷积神经网络的硬件加速设计
3.1 卷积层的硬件加速设计
3.2 批标准化的硬件加速设计
3.3 其他硬件加速相关设计
3.3.1 乒乓缓存机制
3.3.2 流水线机制
3.3.3 背压机制
3.4 本章小结
第四章 基于Zynq平台的卷积神经网络计算模型设计
4.1 计算模型总体架构
4.2 卷积神经网络计算模块设计
4.2.1 卷积神经网络计算模块总体设计
4.2.2 计算阵列区的设计
4.2.3 后处理区的设计
4.2.4 流计算区的设计
4.3 PL端其他模块的设计
4.3.1 DDR内存通信模块的设计
4.3.2 调试接口设计
4.3.3 处理系统端与可编程逻辑端的通信设计
4.4 PS端设计
4.5 性能优化设计
4.5.1 输入位宽与输出位宽不等的FIFO缓存设计
4.5.2 单路输入多路输出的乒乓缓存设计
4.5.3 基于单个块内存的乒乓缓存设计
4.5.4 支持流水线机制的背压机制
4.5.5 后处理区的多路优化设计
4.6 本章小结
第五章 计算模型验证与分析
5.1 Yolov2-tiny网络结构分析
5.2 正确性验证
5.2.1 验证方法设计
5.2.2 实验数据及分析
5.3 计算性能验证
5.3.1 验证方法设计
5.3.2 实验数据及分析
5.4 可拓展性分析
5.5 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的成果
本文编号:3749403
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3749403.html