星载GPU阵列下的SIFT算法的研究
发布时间:2020-05-22 14:36
【摘要】:SIFT特征(Scale-invariant feature transform)是一种具有多尺度以及具有光照不变性和旋转不变性的特征。在遥感图像处理中,基于SIFT特征的图像匹配稳定性强,且能满足多尺度和多传感器的图像之间的匹配。但SIFT特征具有计算复杂度高的缺陷,限制了其在一些场景下的应用。自从NVIDIA推出CUDA(Compute Unified Device Architecture)这一并行计算平台,降低了在图形处理器(GPU)上的编程难度以后,越来越多的科研人员以及工程师利用GPU加速遇到的计算问题。本文面向遥感任务的卫星在轨智能处理设计理念,针对空间任务需求和在轨数据处理带来的挑战,为遥感卫星的星载微型超级计算中心设计SIFT算法的并行加速方案。本文利用OpenMP技术和CUDA技术实现了多GPU下的SIFT算法加速。首先对SIFT算法进行了可并行行分析,给出了在异构模式下,主机端和设备端的任务分配。同时给出了在多GPU下的数据分块,以及并行化方式。随后针对SIFT算法中计算量大的步骤做了并行化处理。针对高斯滤波,本文将二维的高斯滤波分解为先对行做高斯滤波,再对列做高斯滤波,并在此基础上利用GPU加速。在行滤波阶段,利用线程束共享寄存器数据,减少内存的使用,并将中间结果以转置的方式存入共享内存,在避免存储体冲突的情况下还能减少对全局内存的访问。在极值点检测优化中,采用和高斯分离滤波类似的策略,同时引入了原子操作来保证每次对比的正确性。在特征点生成的优化中,引入了共享内存减少原子操作带来的冲突,提高程序的并行化率,同时将数据绑定到纹理内存,增加程序的缓存命中。最后在单GPU的SIFT算法基础上,实现了SIFT算法的多GPU加速,并使用CUDA流将多个数据分块的数据拷贝和内核函数的执行重叠起来,减少程序运行时间。在Jetson TX2硬件平台上对本文的实现做测试,单GPU计算下的特征点个数比CPU计算下的特征点个数平均少百分之八左右,但加速比都达到了82以上,并且随着图像分辨率增大而增大。两个GPU计算下的特征点个数和单GPU计算下的特征点个数基本一致,加速比达到1.5倍左右。本文在多GPU下实现的SIFT算法,整体加速效果比较显著,在小分辨率以及大分辨率下都能很好的加速。
【图文】:
CPU和GPU浮点运行性能对比
2图 1-2 CPU 和 GPU 内存带宽2006 年针对传统 GPU 在通用计算中的缺点,NVIDIA 正式推出 CUDA 这种软硬件架构。CUDA 采用的开发语言是在 C 语言上改进而来的,语法和 C 语言相同,容易上手。在编程中,GPU 中的缓存是对用户可见的,这方便用户针对自己的算法进行优化。CUDA 有着完整的生态链,NVIDIA 提供 Nsight 来帮助用户调试并行程序,定位错误。同时提供 Visual profile 给用户,,帮助用户优化程序,在 Visua
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP751
本文编号:2676146
【图文】:
CPU和GPU浮点运行性能对比
2图 1-2 CPU 和 GPU 内存带宽2006 年针对传统 GPU 在通用计算中的缺点,NVIDIA 正式推出 CUDA 这种软硬件架构。CUDA 采用的开发语言是在 C 语言上改进而来的,语法和 C 语言相同,容易上手。在编程中,GPU 中的缓存是对用户可见的,这方便用户针对自己的算法进行优化。CUDA 有着完整的生态链,NVIDIA 提供 Nsight 来帮助用户调试并行程序,定位错误。同时提供 Visual profile 给用户,,帮助用户优化程序,在 Visua
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP751
【参考文献】
相关期刊论文 前10条
1 吴志辉;徐小红;朱同林;;基于CUDA的直方图问题并行优化[J];现代计算机(专业版);2015年19期
2 闫钧华;杭谊青;许俊峰;储林臻;;基于CUDA的高分辨率数字视频图像配准快速实现[J];仪器仪表学报;2014年02期
3 王刚;唐杰;武港山;;基于多GPU集群的编程框架[J];计算机技术与发展;2014年01期
4 王蓓蕾;朱志良;孟t-;;基于CUDA加速的SIFT特征提取[J];东北大学学报(自然科学版);2013年02期
5 肖汉;周清雷;张祖勋;;基于多GPU的Harris角点检测并行算法[J];武汉大学学报(信息科学版);2012年07期
6 张钦;张鹏程;;运用OpenMP和CUDA优化蒙特卡洛算法[J];安阳师范学院学报;2012年02期
7 张丹丹;徐莹;徐磊;;异构平台下格子Boltzmann方法实现及性能分析[J];计算机科学;2012年04期
8 吕亚飞;贾X阳;;基于CUDA的快速中值滤波算法[J];现代计算机(专业版);2011年14期
9 卢文龙;王建军;刘晓军;;基于CUDA的高速并行高斯滤波算法[J];华中科技大学学报(自然科学版);2011年05期
10 张海军;陈圣波;张旭晴;王亚楠;;基于GPU的遥感图像快速去噪处理[J];城市勘测;2010年02期
本文编号:2676146
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/2676146.html