当前位置:主页 > 科技论文 > 信息工程论文 >

基于异构SIMD并行的高分辨率星载SAR快速成像研究

发布时间:2017-08-02 18:05

  本文关键词:基于异构SIMD并行的高分辨率星载SAR快速成像研究


  更多相关文章: 合成孔径雷达 单指令多数据 快速成像 协同计算


【摘要】:综合孔径雷达(Synthetic Aperture Radar, SAR)技术近几年有了很快的发展,更高的分辨率以及更大的照射范围都使地面处理系统面临着越来越庞大的数据量,与此同时,对于SAR数据处理的性能和效率的要求也在同时变得更加严格。因此,人们对于SAR快速甚至实时成像系统的研究也越来越深入,各种高性能计算的平台和方法越来越多地被运用到SAR成像系统中去。在现有的快速SAR成像方法中,利用图形处理器加速的例子非常多见。传统的基于GPU的快速SAR成像方法中,GPU由于自身的超多线程、大规模并行的模式,而被用作SAR成像系统中主要的计算处理器,承担算法中主要的甚至所有的计算工作,与此同时,中央处理器(Central Processing Unit, CPU)只被用来承担一些算法实现过程中辅助性的工作,比如数据的读取与存盘(Input/Output, I/O),流程控制等工作。因此,传统的基于GPU的快速SAR成像方法中,CPU的计算资源和计算能力是被低估甚至忽略的。本文设计了一种基于深度CPU/GPU异构协同并行计算的快速SAR成像方法。通过面向异构协同并行计算的合理分块以及任务调度策略,整个成像算法可以部署到CPU和GPU上协同并行实现。部署在CPU上的并行任务,本文首次在多核CPU的基础上引入基于单指令多数据(SingleInstruction Multiple Data, SIMD)架构的高级矢量扩展指令集(Advanced Vector Extensions, AVX)来进行深度的并行优化。部署在GPU上的并行任务部分,借助英伟达(NVIDIA)的统一计算设备架构,本文解决了现有的基于GPU实现的快速SAR成像方法面临的两个问题,其一是有限的显存对SAR回波数据量的限制;其二是避免了现有方法中过于频繁的设备和主机之间的内存拷贝行为。在此基础上还运用了很丰富的优化策略,比如流技术,并行流水线等。实验结果表明,与基于单核CPU的SAR成像算法相比,本文提出的这种深度CPU/GPU异构协同并行计算的快速SAR成像方法比起经典的单核CPU实现的SAR成像算法可以提高大约270倍的运行效率。基于这种方法的SAR数据处理的效率远高于SAR数据生成的效率,所以可以说这种方法实现了SAR的实时成像。
【关键词】:合成孔径雷达 单指令多数据 快速成像 协同计算
【学位授予单位】:北京化工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN957.52
【目录】:
  • 学位论文数据集3-4
  • 摘要4-6
  • ABSTRACT6-15
  • 第一章 绪论15-23
  • 1.1 课题背景意义15-16
  • 1.2 课题研究现状16-19
  • 1.2.1 经典合成孔径雷达成像方法概述16-17
  • 1.2.2 快速合成孔径雷达成像方法概述17-19
  • 1.3 课题研究内容19-20
  • 1.4 全文组织结构20-23
  • 第二章 SAR基础理论23-39
  • 2.1 合成孔径雷达原理24-28
  • 2.1.1 SAR的分辨能力24-25
  • 2.1.2 SAR数据采集25-27
  • 2.1.3 点目标回波的生成27-28
  • 2.2 合成孔径雷达成像处理基础28-33
  • 2.2.1 星载SAR成像几何29-31
  • 2.2.2 星载SAR成像模式31
  • 2.2.3 星载SAR成像原理31-33
  • 2.3 合成孔径雷达成像处理算法33-37
  • 2.3.1 RD算法33-35
  • 2.3.2 CS算法35-37
  • 2.4 本章小结37-39
  • 第三章 基于CPU的快速星载SAR成像39-53
  • 3.1 CPU并行技术介绍39-41
  • 3.1.1 基于OpenMP的单机多CPU并行技术39-40
  • 3.1.2 基于SSE/AVX的SIMD CPU矢量化并行技术40-41
  • 3.2 CPU平台下星载SAR成像的并行性分析41-44
  • 3.2.1 基于OpenMP的粗粒度并行性分析42-43
  • 3.2.2 基于AVX的细粒度并行性分析43-44
  • 3.3 基于多核CPU和SIMD的星载SAR并行成像44-50
  • 3.3.1 并行算法设计44-46
  • 3.3.2 矩阵转置的优化46-47
  • 3.3.3 快速傅里叶变换的优化47-48
  • 3.3.4 相位相乘的优化48-50
  • 3.4 实验结果与分析50-52
  • 3.5 本章小结52-53
  • 第四章 基于GPU的快速星载SAR成像53-67
  • 4.1 GPU并行技术综述53-57
  • 4.1.1 线程级的并行53-55
  • 4.1.2 任务级的并行55-56
  • 4.1.3 设备级的并行56-57
  • 4.2 GPU平台下的星载SAR成像并行性分析57-59
  • 4.2.1 基于多GPU的粗粒度并行性分析57-58
  • 4.2.2 基于单GPU的细粒度并行性分析58-59
  • 4.3 基于GPU的星载SAR并行成像59-64
  • 4.3.1 并行算法设计59-61
  • 4.3.2 矩阵转置的优化61-63
  • 4.3.3 快速傅里叶变换的优化63
  • 4.3.4 相位相乘的优化63-64
  • 4.4 实验结果与分析64-66
  • 4.5 本章小结66-67
  • 第五章 基于CPU/GPU异构协同并行的快速星载SAR成像67-81
  • 5.1 异构协同并行快速SAR成像算法分析67-69
  • 5.2 异构协同并行快速SAR成像算法设计69-77
  • 5.2.1 双向的数据分块策略71-72
  • 5.2.2 基于多GPU和多核CPU的粗粒度任务划分72-73
  • 5.2.3 基于流调度和AVX的细粒度任务划分73-75
  • 5.2.4 基于异构协同计算的内存行为优化75-77
  • 5.3 实验结果与分析77-80
  • 5.4 本章小结80-81
  • 第六章 总结与展望81-83
  • 6.1 结论81-82
  • 6.2 展望82-83
  • 参考文献83-87
  • 致谢87-89
  • 研究成果及发表的学术论文89-91
  • 作者和导师简介91-93
  • 附件93-94

【相似文献】

中国期刊全文数据库 前10条

1 张为华;臧斌宇;王晔;钱兴隆;朱传琪;;基于共享向量的二维SIMD调度算法[J];计算机学报;2006年10期

2 李璞;孙亚辉;;64位环境SIMD性能优化技术研究[J];计算机与信息技术;2007年04期

3 卜士喜;竺红卫;;软件SIMD的研究及应用[J];计算机工程;2010年19期

4 侯永生;赵荣彩;黄磊;韩林;;面向SIMD扩展部件的循环优化研究[J];计算机科学;2014年05期

5 张为华;臧斌宇;;共享主存多SIMD结构及编译技术研究[J];计算机科学与探索;2009年01期

6 郭阳;丁伟;李振涛;;高性能算术SIMD模块的电路设计[J];微电子学与计算机;2010年09期

7 侯永生;赵荣彩;高伟;朱嘉枫;;SIMD扩展部件数据依赖关系约束条件研究[J];信息工程大学学报;2014年01期

8 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期

9 周西汉,刘勃,周荷琴,袁非牛;一种基于奔腾SIMD指令的快速背景提取方法[J];计算机工程与应用;2004年27期

10 张倩;;二维SIMD结构的低功耗调度[J];计算机工程;2009年10期

中国重要会议论文全文数据库 前7条

1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

2 付光远;;基于SIMD-MPP并行模型的图像调度与映射方法研究[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

3 高巍;宋妍;;基于SIMD体系结构的数据相关控制语句转化方法[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年

4 朱明慧;;ADI浮点DSP软件编程中的指令并行与SIMD应用[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年

5 李彦洁;庞一;孙立峰;;多视点视频编码中的SIMD优化研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年

6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四届中国卫星导航学术年会论文集-S7 北斗/GNSS用户终端技术[C];2013年

7 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

中国博士学位论文全文数据库 前8条

1 杨惠;面向性能的SIMD DSP指令流调度技术研究[D];国防科学技术大学;2014年

2 侯永生;多重循环SIMD向量化方法及性能优化技术研究[D];解放军信息工程大学;2014年

3 张为华;共享主存多SIMD结构编译优化及结构研究[D];复旦大学;2006年

4 李玉祥;面向非多媒体程序的SIMD向量化方法及优化技术研究[D];中国科学技术大学;2008年

5 张凯;向量SIMD DSP上高效矩阵运算技术研究[D];国防科学技术大学;2013年

6 朱嘉华;SIMD编译优化方法研究[D];复旦大学;2005年

7 姜伟华;针对实际多媒体程序和多媒体扩展指令集的SIMD编译优化[D];复旦大学;2005年

8 魏帅;面向SIMD的向量化算法及重组技术研究[D];解放军信息工程大学;2012年

中国硕士学位论文全文数据库 前10条

1 沈阳;基于SIMD指令的多核软件渲染器的设计与实现[D];浙江大学;2015年

2 王力;SIMD指令在生物序列串匹配里的应用[D];北京理工大学;2015年

3 黄娟娟;多线程多SIMD自动向量化技术研究[D];国防科学技术大学;2013年

4 赵芮;一款高性能64位DSP中SIMD结构FMAC的设计与验证[D];国防科学技术大学;2014年

5 林宗华;X-DSP定点乘累加的设计优化与验证[D];国防科学技术大学;2014年

6 宋贵环;YHFT-Matrix2编译器SIMD优化技术研究与实现[D];国防科学技术大学;2014年

7 黄胜兵;面向BWDSP的SIMD编译优化技术研究与实现[D];中国科学技术大学;2016年

8 胡辰;基于异构SIMD并行的高分辨率星载SAR原始数据快速模拟研究[D];北京化工大学;2016年

9 李国君;基于异构SIMD并行的高分辨率星载SAR快速成像研究[D];北京化工大学;2016年

10 张倩;二维SIMD结构的低功耗调度[D];复旦大学;2008年



本文编号:610530

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/610530.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2f36d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com