卷积检测模型的GPU加速研究

发布时间:2017-03-19 08:07

  本文关键词:卷积检测模型的GPU加速研究,,由笔耕文化传播整理发布。


【摘要】:近年来,形变部件模型和卷积神经网络等卷积检测模型在目标检测领域取得了极大的成功。这类模型能够进行大规模的机器学习训练,实现较高的鲁棒性和识别性能。然而训练和检测过程中卷积运算巨大的计算开销,却限制了其在诸多实际场景中进一步地应用。幸运的是,GPU通用并行计算技术日益成熟,为加速卷积检测模型提供了可行的解决方案。在深入研究卷积检测模型,分析其性能瓶颈后,本文在不损失检测精度的前提下,利用数学理论和并行技术对卷积检测模型实现了算法和硬件的双重加速。在算法层面,本文通过应用卷积定理,将空间域中的卷积运算转换为频率域中的点乘运算来降低模型计算复杂度,同时利用启发式装箱算法有效地平衡了存储开销和计算开销之间的矛盾。在PASCAL VOC数据集上的实验表明,此频域加速算法能够在保证检测精度的情况下有效地加速卷积检测模型。在硬件层面,本文在详细地分析频域加速算法并行性的基础上,使用Open CL对其进行了GPU加速实现,并采用内存访问优化、数据传输优化、控制流优化等OpenCL优化方法提高GPU实现的性能。实验结果表明,相对于传统CPU实现,本文GPU实现能够加速效果明显,而相对于完善优化的CPU实现亦能有一定的性能提升。此外,本文还研究了HOG特征的GPU加速实现和优化问题。实验结果表明,本文GPU实现相比于CPU能够取得一定的加速效果。
【关键词】:目标检测 形变部件模型 卷积神经网络 GPU通用并行计算 Open CL HOG
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41;TP183
【目录】:
  • 摘要3-4
  • ABSTRACT4-10
  • 第一章 绪论10-16
  • 1.1 研究背景与意义10-11
  • 1.2 研究现状11-14
  • 1.3 研究内容与主要工作14-15
  • 1.4 章节安排15-16
  • 第二章 主流卷积检测模型16-31
  • 2.1 形变部件模型16-24
  • 2.1.1 HOG特征16-18
  • 2.1.2 混合形变部件模型18-20
  • 2.1.3 模板匹配20-23
  • 2.1.4 Latent SVM23-24
  • 2.2 卷积神经网络24-30
  • 2.2.1 网络结构24-28
  • 2.2.2 卷积层28-29
  • 2.2.3 采样层29-30
  • 2.3 本章小结30-31
  • 第三章 卷积检测模型的频域加速31-48
  • 3.1 频域加速算法32-39
  • 3.1.1 计算复杂度分析32-34
  • 3.1.2 快速傅里叶变换34-36
  • 3.1.3 拼接策略36-39
  • 3.2 算法基本流程39-41
  • 3.3 实验结果与分析41-47
  • 3.4 本章小结47-48
  • 第四章 卷积检测模型的GPU加速48-65
  • 4.1 OpenCL简介48-53
  • 4.1.1 平台模型48-49
  • 4.1.2 执行模型49-51
  • 4.1.3 内存模型51-52
  • 4.1.4 编程模型52-53
  • 4.2 算法并行性分析53-56
  • 4.2.1 数据并行性53-54
  • 4.2.2 任务并行性54-56
  • 4.3 GPU并行实现与优化56-62
  • 4.3.1 OpenCL实现56-58
  • 4.3.2 OpenCL优化58-62
  • 4.4 实验结果与分析62-64
  • 4.5 本章小结64-65
  • 第五章 HOG特征的GPU加速65-72
  • 5.1 HOG特征概述65-67
  • 5.2 GPU并行实现与优化67-70
  • 5.2.1 计算图像梯度68
  • 5.2.2 统计梯度直方图68-69
  • 5.2.3 计算梯度能量69-70
  • 5.2.4 构建特征70
  • 5.3 实验结果与分析70-71
  • 5.4 本章小结71-72
  • 第六章 总结与展望72-74
  • 6.1 本文工作总结72-73
  • 6.2 后续研究展望73-74
  • 参考文献74-79
  • 致谢79-80
  • 攻读硕士学位期间已发表或录用的论文80-82

【参考文献】

中国期刊全文数据库 前2条

1 黄凯奇;任伟强;谭铁牛;;图像物体分类与检测算法综述[J];计算机学报;2014年06期

2 李焱;张云泉;刘益群;龙国平;贾海鹏;;MPFFT:An Auto-Tuning FFT Library for OpenCL GPUs[J];Journal of Computer Science & Technology;2013年01期


  本文关键词:卷积检测模型的GPU加速研究,由笔耕文化传播整理发布。



本文编号:255763

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/255763.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f4ebb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com