基于FPGA的复合卷积神经网络算法加速设计
发布时间:2021-04-25 10:07
视觉是人类获得外界信息的重要手段,对于因视觉通路病变或受损的病患,盲人辅助系统能够有效的帮助其完成部分日常生活中的视觉任务。随着卷积神经网络等新技术的应用,盲人辅助系统能够对盲人所提供的帮助越来越丰富。但是深度学习等新技术在应用过程中存在计算消耗大、计算时间长等问题,这使得卷积神经网络难以在盲人辅助系统等轻量型平台中实现,因此对FPGA平台下的轻量型卷积神经网络进行模型和电路的协同化设计具有重要的意义。本文以GoogLeNet模型和SqueezeNet模型为基础,针对原有模型在FPGA平台中并行度低、流水效率差等问题,从硬件实现的角度出发提出了改进的并行化Inception算法模型。通过对GoogLeNet模型和SqueezeNet模型进行分析,调整Inception算法的数据流计算流程,修改了原始模型中的网络结构,并重新剪裁获得了一个适于FPGA平台部署的高准确率、轻量型卷积神经网络模型。通过与RCNN-A2模型、Maxout模型、DSN模型等其他经典的轻量级网络模型在标准CIFAR数据集上进行对比测试,实验结果表明了改进的Inception模型获得了 90.04%的准确率,比Max...
【文章来源】:西安理工大学陕西省
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究进展
1.3 研究的主要内容及结构
2 并行深卷积神经网络模型介绍
2.1 基于参数压缩的SqueezeNet模型
2.1.1 SqueezeNet模型核心结构
2.1.2 SqueezeNet模型参数压缩原理
2.2 基于多分支视野的GoogLeNet模型
2.2.1 GoogLeNet模型核心结构
2.2.2 GoogLeNet模型参数压缩分析
2.2.3 GoogLeNet模型隔离运算分析
2.3 标准测试库
2.3.1 CIFAR-10 测试库
2.4 本章小结
3 深卷积神经网络改进设计
3.1 经典深卷积神经网络模型硬件化缺陷
3.1.1 SqueezeNet模型硬件化缺陷
3.1.2 GoogLeNet模型并行化缺陷
3.2 改进的多分支深卷积神经网络模型
3.2.1 多分支同步化
3.2.2 基于DepthWise结构的结构折叠
3.3 实验结果及分析
3.4 本章小结
4 算法加速电路硬件实现
4.1 加速电路总体框架
4.2 算法计算流程
4.3 算法计算核心的设计
4.3.1 边界处理
4.3.2 3×3 卷积/池化计算模块设计
4.3.3 5×1 卷积/池化计算模块设计
4.3.4 1×1 卷积计算模块设计
4.4 指令控制及数据流总控系统
4.4.1 指令控制协议及模块设计
4.4.2 数据总控模块设计
4.5 本章小结
5 电路的平台验证
5.1 验证平台介绍
5.2 验证平台搭建
5.2.1 模块时钟域划分
5.2.2 测试数据流生成
5.3 验证结果及分析
5.4 本章小结
6 总结以及展望
6.1 工作总结
6.2 后期工作展望
致谢
参考文献
本文编号:3159198
【文章来源】:西安理工大学陕西省
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
1 绪论
1.1 研究背景与意义
1.2 国内外研究进展
1.3 研究的主要内容及结构
2 并行深卷积神经网络模型介绍
2.1 基于参数压缩的SqueezeNet模型
2.1.1 SqueezeNet模型核心结构
2.1.2 SqueezeNet模型参数压缩原理
2.2 基于多分支视野的GoogLeNet模型
2.2.1 GoogLeNet模型核心结构
2.2.2 GoogLeNet模型参数压缩分析
2.2.3 GoogLeNet模型隔离运算分析
2.3 标准测试库
2.3.1 CIFAR-10 测试库
2.4 本章小结
3 深卷积神经网络改进设计
3.1 经典深卷积神经网络模型硬件化缺陷
3.1.1 SqueezeNet模型硬件化缺陷
3.1.2 GoogLeNet模型并行化缺陷
3.2 改进的多分支深卷积神经网络模型
3.2.1 多分支同步化
3.2.2 基于DepthWise结构的结构折叠
3.3 实验结果及分析
3.4 本章小结
4 算法加速电路硬件实现
4.1 加速电路总体框架
4.2 算法计算流程
4.3 算法计算核心的设计
4.3.1 边界处理
4.3.2 3×3 卷积/池化计算模块设计
4.3.3 5×1 卷积/池化计算模块设计
4.3.4 1×1 卷积计算模块设计
4.4 指令控制及数据流总控系统
4.4.1 指令控制协议及模块设计
4.4.2 数据总控模块设计
4.5 本章小结
5 电路的平台验证
5.1 验证平台介绍
5.2 验证平台搭建
5.2.1 模块时钟域划分
5.2.2 测试数据流生成
5.3 验证结果及分析
5.4 本章小结
6 总结以及展望
6.1 工作总结
6.2 后期工作展望
致谢
参考文献
本文编号:3159198
本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/3159198.html