面向目标检测的神经网络推理加速方法研究
发布时间:2021-05-17 18:08
目标检测是计算机视觉领域的一个热门研究方向,被广泛应用于智能安防、智慧城市、电力巡检、无人驾驶等众多领域。与传统的基于手工设计特征的算法相比,使用深度神经网络的目标检测算法无论是检测精度还是检测速度都获得了巨大的提升。深度神经网络是一种存储密集型和计算密集型的算法,该算法可以在高性能GPU上实时的运行,但是在存储资源和计算资源有限的嵌入式平台上却难以实现。因此,研究如何在保证检测精度的前提下将目标检测算法部署到嵌入式平台上具有极其重要的现实意义。本文在YOLOv3目标检测算法的基础上,结合轻量级神经网络、模型压缩和计算加速技术在嵌入式ARM平台上实现了 一个实时的目标检测系统。具体工作内容如下:(1)针对YOLOv3算法,本文通过对比几个主流的轻量级神经网络,最终选取模型参数少且特征提取能力强的MobiNetV2代替Darknet53作为YOLOv3算法的主干网络。(2)卷积神经网络的模型压缩方面,本文使用一种基于通道剪枝的模型压缩方法主要针对批量归一化层前面的卷积层进行通道剪枝,卷积输出特征图的每个通道都有批量归一化层的缩放因子与之对应,通过对缩放因子施加L1正则化惩罚可以得到稀疏化...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外发展现状
1.2.1 目标检测算法研究现状
1.2.2 轻量化神经网络研究现状
1.3 论文主要研究内容
1.4 章节安排
第二章 相关理论基础
2.1 YOLOv3算法
2.1.1 网络结构
2.1.2 维度聚类
2.1.3 RPN网络
2.1.4 Bounding box回归
2.2 MobileNetV2网络结构
2.2.1 深度可分离卷积
2.2.2 线性瓶颈结构
2.2.3 反向残差结构
2.3 计算加速
2.3.1 NEON指令简介
2.3.2 AVX2指令简介
2.3.3 OpenMP简介
2.4 本章小结
第三章 基于通道剪枝的模型压缩方法
3.1 通道剪枝的基本原理
3.2 通道选择标准
3.3 通道剪枝的实现
3.4 本章小节
第四章 目标检测模型前向推理过程的优化与实现
4.1 神经网络的设计与实现
4.1.1 基本组件设计
4.1.2 卷积层的实现
4.2 网络层合并
4.3 NEON加速卷积神经网络计算
4.3.1 内存对齐
4.3.2 NEON指令优化计算
4.4 AVX2加速卷积神经网络计算
4.5 本章小节
第五章 实验与分析
5.1 轻量级神经网络性能对比实验
5.2 模型压缩实验
5.3 推理加速实验
5.4 结论
第六章 总结与展望
6.1 全文总结
6.2 未来展望
参考文献
致谢
攻读学位期间发表的学术论文
学位论文评阅及答辩情况表
【参考文献】:
期刊论文
[1]基于AVX2指令集的深度学习混合运算策略[J]. 蒋文斌,王宏斌,刘湃,陈雨浩. 清华大学学报(自然科学版). 2020(05)
[2]基于多元统计分析和机器学习的验证码识别[J]. 虞水磊,田新宇,王金燕. 山东理工大学学报(自然科学版). 2019(01)
本文编号:3192205
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外发展现状
1.2.1 目标检测算法研究现状
1.2.2 轻量化神经网络研究现状
1.3 论文主要研究内容
1.4 章节安排
第二章 相关理论基础
2.1 YOLOv3算法
2.1.1 网络结构
2.1.2 维度聚类
2.1.3 RPN网络
2.1.4 Bounding box回归
2.2 MobileNetV2网络结构
2.2.1 深度可分离卷积
2.2.2 线性瓶颈结构
2.2.3 反向残差结构
2.3 计算加速
2.3.1 NEON指令简介
2.3.2 AVX2指令简介
2.3.3 OpenMP简介
2.4 本章小结
第三章 基于通道剪枝的模型压缩方法
3.1 通道剪枝的基本原理
3.2 通道选择标准
3.3 通道剪枝的实现
3.4 本章小节
第四章 目标检测模型前向推理过程的优化与实现
4.1 神经网络的设计与实现
4.1.1 基本组件设计
4.1.2 卷积层的实现
4.2 网络层合并
4.3 NEON加速卷积神经网络计算
4.3.1 内存对齐
4.3.2 NEON指令优化计算
4.4 AVX2加速卷积神经网络计算
4.5 本章小节
第五章 实验与分析
5.1 轻量级神经网络性能对比实验
5.2 模型压缩实验
5.3 推理加速实验
5.4 结论
第六章 总结与展望
6.1 全文总结
6.2 未来展望
参考文献
致谢
攻读学位期间发表的学术论文
学位论文评阅及答辩情况表
【参考文献】:
期刊论文
[1]基于AVX2指令集的深度学习混合运算策略[J]. 蒋文斌,王宏斌,刘湃,陈雨浩. 清华大学学报(自然科学版). 2020(05)
[2]基于多元统计分析和机器学习的验证码识别[J]. 虞水磊,田新宇,王金燕. 山东理工大学学报(自然科学版). 2019(01)
本文编号:3192205
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3192205.html