当前位置:主页 > 科技论文 > 软件论文 >

GPU上基本图像处理算法性能优化关键技术研究

发布时间:2019-02-15 04:39
【摘要】:图像处理主要包括图像压缩、图像滤波、图像采样、图像分割和图像分析等,目前在众多实际应有领域都有重要应有,如目前应用广泛的图像识别,人脸识别等,其技术核心均是图像处理问题。随着这些领域图像处理规模的不断扩大以及对实时性能要求的不断提高,如何提高图像处理算法的性能已经成为当前的研究热点。GPU(Graphics Processing Units)在处理能力和存储带宽上相对CPU都有无可比拟的优势,其发展为图像处理应用的实时性要求提供了解决方案。鉴于OpenCL的跨平台特性,本文将使用OpenCL在GPU上实现并行图像处理的相关操作,可大幅提升图像处理算法性能,对于前面提到的相关问题无疑是一个很好的解决方法。同时,图像处理算法通常具有数据量大以及计算访存密集的特点,在GPU上并行化处理是切实可行的解决方案。因此,本文将针对图像处理算法在GPU上的实现以及优化方法进行研究。由于GPU架构的复杂性和硬件资源的限制,性能优化成为GPU编程的难点和重点,GPU优化的本质是实现算法特征向底层硬件架构特征的高效映射。本文将结合图像处理算法特性和底层硬件架构特征开展图像处理算法在GPU计算平台上的性能优化研究。本文针对常用的图像处理算法类型进行研究,包括上采样、下采样、归约、水平滤波、垂直滤波、卷积,过冲控制等。由于这些算法分别具有不同的计算访存特征,因此,本文将结合GPU硬件平台特性,从数据传输优化、访存优化、NDRange优化、指令流优化、数据共享优化和数据相关优化等角度总结具有不同特征的图像处理算法在GPU上的性能瓶颈和优化方法。本文的主要工作如下:1)Sharpness综合图像处理算法在GPU计算平台上的实现和优化。对Sharpness中所包含的基本图像处理算法进行了算法分析和并行性分析。对GPU上的Sharpness算法采取的优化方式包括:数据传输优化,kernel融合,归约优化,向量化及数据本地化优化,边界优化和其他基本优化方法。同时研究了Sharpness算法在SIMD上的优化。对比分析了Sharpness算法CPU版本的性能、SIMD优化后版本的性能以及GPU优化后版本的性能。2)同时也分析了Laplacian综合图像处理算法,对Laplacian中所包含的基本图像处理算法进行了算法分析和并行性分析。对GPU上的Laplacian算法采用的优化方法包括:kernel融合、减少全局同步并精简算法,添加padding、减少条件判断并解决数据对齐问题。同时介绍了Laplacian算法在SIMD上的优化。对比分析了Laplacian算法CPU版本的性能、SIMD优化后版本的性能以及GPU优化后版本的性能。实验结果可以看出,GPU加速图像处理算法具有无可比拟的优势,同时由于GPU硬件架构的特性,为移植到GPU上的算法进行针对硬件架构的优化对于性能有较大影响。
[Abstract]:Image processing mainly includes image compression, image filtering, image sampling, image segmentation and image analysis. The core of its technology is image processing. With the increasing scale of image processing in these fields and the increasing demand for real-time performance, How to improve the performance of image processing algorithm has become a research hotspot in the current research. GPU (Graphics Processing Units) has an unparalleled advantage over CPU in terms of processing capacity and storage bandwidth. It provides a solution for the real-time application of image processing. In view of the cross-platform characteristics of OpenCL, this paper will use OpenCL to implement parallel image processing operations on GPU, which can greatly improve the performance of image processing algorithm. It is undoubtedly a good solution to the related problems mentioned above. At the same time, image processing algorithms usually have the characteristics of large amount of data and dense computing access. Parallel processing is a feasible solution on GPU. Therefore, this paper will focus on the implementation of image processing algorithm on GPU and the optimization method. Because of the complexity of GPU architecture and the limitation of hardware resources, performance optimization has become the difficulty and focus of GPU programming. The essence of GPU optimization is to realize the efficient mapping between algorithm features and underlying hardware architecture features. In this paper, the performance optimization of image processing algorithm on GPU computing platform is studied based on the characteristics of image processing algorithm and underlying hardware architecture. In this paper, the types of image processing algorithms are studied, including up-sampling, down-sampling, reduction, horizontal filtering, vertical filtering, convolution, overshoot control and so on. Because these algorithms have different computational memory access characteristics, this paper will combine the characteristics of GPU hardware platform, from data transmission optimization, memory access optimization, NDRange optimization, instruction flow optimization, The performance bottlenecks and optimization methods of image processing algorithms with different characteristics on GPU are summarized from the point of view of data sharing optimization and data correlation optimization. The main work of this paper is as follows: 1) the realization and optimization of Sharpness synthetic image processing algorithm on GPU computing platform. The algorithm analysis and parallelism analysis of the basic image processing algorithm included in Sharpness are carried out. The optimization methods of Sharpness algorithm on GPU include: data transmission optimization, kernel fusion, reduction optimization, vectorization and data localization optimization, boundary optimization and other basic optimization methods. At the same time, the optimization of Sharpness algorithm on SIMD is studied. The performance of the CPU version of the Sharpness algorithm, the performance of the optimized version of SIMD and the performance of the optimized version of GPU are compared and analyzed. 2) at the same time, the comprehensive image processing algorithm of Laplacian is also analyzed. The algorithm analysis and parallelism analysis of the basic image processing algorithm included in Laplacian are carried out. The optimization methods for Laplacian algorithm on GPU include: kernel fusion, reducing global synchronization and reducing algorithm, adding padding, to reduce conditional judgment and solving the problem of data alignment. At the same time, the optimization of Laplacian algorithm on SIMD is introduced. The performance of CPU version of Laplacian algorithm, the performance of optimized version of SIMD and the performance of optimized version of GPU are compared and analyzed. The experimental results show that the GPU accelerated image processing algorithm has unparalleled advantages. At the same time because of the characteristics of the GPU hardware architecture the optimization of the hardware architecture for the algorithm transplanted to GPU has a great impact on the performance.
【学位授予单位】:中国科学院大学(中国科学院工程管理与信息技术学院)
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 张桂林;张留洋;;数字图像处理算法评估系统的硬件设计[J];计算机与数字工程;2005年12期

2 张永良;李忠海;;图像处理算法的效果评价标准分析[J];武汉理工大学学报(交通科学与工程版);2006年02期

3 侯相深,王哲人,杨泽众;路面损坏的图像处理算法浅析[J];公路;2003年03期

4 熊杰;刘彩云;;基于消息传递接口的并行图像处理算法研究[J];成都大学学报(自然科学版);2010年02期

5 罗传萍;;关于使用多值逻辑运算的计算机图像处理算法研究[J];交通与计算机;1991年05期

6 吴晓;曹其新;;白点定位图像处理算法[J];中国矿业大学学报;2008年06期

7 马洁;;一种基于线性代数的图像处理算法研究[J];计算机科学;2012年11期

8 伯绍波;闫茂德;孙国军;贺昱曜;;沥青路面裂缝检测图像处理算法研究[J];微计算机信息;2007年15期

9 许文伟;徐德民;;用于无人机着陆的图像处理算法[J];火力与指挥控制;2008年08期

10 刘绍军,于新瑞,梁庆华,王石刚;视觉多功能贴片机中的图像处理算法研究[J];计算机工程与应用;2002年23期

相关会议论文 前5条

1 李莲;马彦锋;周洁;;破损胶囊图像处理算法的比较研究[A];中国仪器仪表学会第十二届青年学术会议论文集[C];2010年

2 许信松;王鲁平;;基于双边滤波的红外图像细节增强算法研究[A];第十届全国光电技术学术交流会论文集[C];2012年

3 郝仁剑;张婷;李佳洪;罗马思阳;;基于DM643自动追踪系统的设计及图像处理算法研究[A];第二十九届中国控制会议论文集[C];2010年

4 李忠科;宋大虎;;三维扫描仪亮带图像处理算法研究[A];第九次全国口腔医学计算机应用学术会议论文汇编[C];2011年

5 张海林;葛思擘;施仁;;基于线阵CCD的烟叶杂质剔除系统的研究[A];中国仪器仪表学会第五届青年学术会议论文集[C];2003年

相关重要报纸文章 前2条

1 华北光电技术研究所 刘刚;FPGA+DSP升级热像设计[N];中国电子报;2010年

2 刘晖;贴近专业的感觉[N];计算机世界;2002年

相关博士学位论文 前5条

1 王建庄;基于FPGA的高速图像处理算法研究及系统实现[D];华中科技大学;2011年

2 郭艳菊;基于仿生智能优化的图像处理算法研究[D];河北工业大学;2014年

3 白旭;电视制导中图像处理算法和信息安全问题研究[D];哈尔滨工业大学;2008年

4 白俊奇;高分辨率红外成像中的图像处理算法研究[D];南京理工大学;2010年

5 魏卓;含GPU环境高清视频图像处理算法研究与实现[D];华中科技大学;2011年

相关硕士学位论文 前10条

1 许卉;基于图像处理算法的嵌入式交通信号控制系统的研究与设计[D];内蒙古大学;2015年

2 齐金;典型图像处理算法在Xeon Phi平台上的实现与优化技术研究[D];国防科学技术大学;2013年

3 章飘艳;生产线产品缺陷检测中的图像处理算法研究[D];南京航空航天大学;2014年

4 罗林;基于FPGA的快速图像处理算法的研究与实现[D];重庆交通大学;2015年

5 王丽丽;轻武器电子校瞄系统研究[D];中北大学;2016年

6 许雪;基于自适应压缩感知的图像处理算法研究[D];北京理工大学;2016年

7 贺瑞芳;视觉假体图像处理算法的研究[D];西安工程大学;2016年

8 李保梁;CAM血管新生图像处理算法研究[D];长春工业大学;2016年

9 李建飞;基于.net框架的数字图像处理算法研究[D];福州大学;2013年

10 王静媛;微扫描显微热成像系统高分辨力图像处理算法研究[D];燕山大学;2016年



本文编号:2422975

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2422975.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fde08***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com