遥感图像几何校正GPU阵列并行算法研究
发布时间:2023-05-05 19:43
随着信息技术和传感器技术的快速发展,卫星遥感图像需要处理的数据量急剧增大,同时实际应用的精度要求和实时性需求也在不断提高,传统的基于多核CPU或CPU集群的遥感图像并行处理,其大规模集群上加速效果较好但成本更高,功耗更大而且也不适合载荷有限的卫星应用环境,其小规模集群由于处理器数目较少并行加速效果有限,而GPU(Graphic Processingg Unit,图形处理器)因其众核并行特性带来强大的数据处理能力,同时兼具低功耗和低成本的优点,因此利用GPU阵列加速遥感图像处理对于构建高性能、低功耗、低成本的星上实时计算系统具有重要意义。本文利用OpenCL(Open Computing Language,开放计算语言)的跨平台特性实现不同平台下GPU的调用,以尽可能地利用所有的计算资源,同时引入了传统多核CPU或CPU集群并行所使用的OpenMP和MPI技术实现GPU阵列的调用,形成不同层次的并行计算架构:基于单节点单GPU的众核并行架构、基于单节点多GPU系统的并行多线程+众核并行架构、基于多节点单GPU系统的多进程+众核并行架构、基于多节点多GPU系统的多进程+多线程+众核并行架构...
【文章页数】:86 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 GPU/OpenCL面向通用计算的研究现状
1.2.2 遥感图像并行处理的现状
1.3 课题主要工作与创新
1.4 论文的结构安排
第二章 异构并行计算与OpenCL概述
2.1 异构并行计算概述
2.2 并行编程模型
2.2.1 MPI
2.2.2 OpenMP
2.2.3 CUDA
2.3 通用并行编程模型—OpenCL
2.3.1 OpenCL概述
2.3.2 OpenCL与 CUDA的差异
2.4 本章小结
第三章 GPU阵列并行计算架构设计和性能优化研究
3.1 GPU阵列并行计算架构设计
3.1.1 总体架构概述
3.1.2 并行计算架构设计
3.2 GPU阵列任务划分策略研究
3.2.1 多GPU负载不均衡问题
3.2.2 负载均衡与任务划分
3.3 GPU性能优化研究
3.3.1 全局存储器访存优化
3.3.2 局部存储器访存优化
3.4 本章小结
第四章 遥感图像几何校正算法并行策略研究
4.1 遥感图像处理概述
4.1.1 遥感图像处理一般流程
4.1.2 遥感图像处理算法分类
4.1.3 遥感图像几何校正分级
4.2 几何校正原理
4.2.1 算法步骤
4.2.2 重采样
4.3 几何校正并行性分析
4.3.1 定性分析—时间复杂度
4.3.2 定量分析—串行算法各阶段执行时间
4.4 几何校正并行化策略
4.4.1 GPU众核并行
4.4.2 图像分块并行
4.5 本章小结
第五章 并行算法实现与实验结果分析
5.1 实验环境说明
5.2 并行算法性能度量标准
5.2.1 执行时间
5.2.2 加速比与Amdahl定律
5.3 基于OpenCL的跨平台实现及性能分析
5.3.1 不同重采样方法的OpenCL实现
5.3.2 跨平台实验结果分析
5.3.3 高分辨率图像的分块优化
5.4 基于GPU阵列的多级并行实现
5.4.1 OpenMP+OpenCL实现
5.4.2 MPI+OpenCL实现
5.4.3 MPI+OpenMP+OpenCL实现
5.5 本章小结
第六章 总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
本文编号:3808290
【文章页数】:86 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 GPU/OpenCL面向通用计算的研究现状
1.2.2 遥感图像并行处理的现状
1.3 课题主要工作与创新
1.4 论文的结构安排
第二章 异构并行计算与OpenCL概述
2.1 异构并行计算概述
2.2 并行编程模型
2.2.1 MPI
2.2.2 OpenMP
2.2.3 CUDA
2.3 通用并行编程模型—OpenCL
2.3.1 OpenCL概述
2.3.2 OpenCL与 CUDA的差异
2.4 本章小结
第三章 GPU阵列并行计算架构设计和性能优化研究
3.1 GPU阵列并行计算架构设计
3.1.1 总体架构概述
3.1.2 并行计算架构设计
3.2 GPU阵列任务划分策略研究
3.2.1 多GPU负载不均衡问题
3.2.2 负载均衡与任务划分
3.3 GPU性能优化研究
3.3.1 全局存储器访存优化
3.3.2 局部存储器访存优化
3.4 本章小结
第四章 遥感图像几何校正算法并行策略研究
4.1 遥感图像处理概述
4.1.1 遥感图像处理一般流程
4.1.2 遥感图像处理算法分类
4.1.3 遥感图像几何校正分级
4.2 几何校正原理
4.2.1 算法步骤
4.2.2 重采样
4.3 几何校正并行性分析
4.3.1 定性分析—时间复杂度
4.3.2 定量分析—串行算法各阶段执行时间
4.4 几何校正并行化策略
4.4.1 GPU众核并行
4.4.2 图像分块并行
4.5 本章小结
第五章 并行算法实现与实验结果分析
5.1 实验环境说明
5.2 并行算法性能度量标准
5.2.1 执行时间
5.2.2 加速比与Amdahl定律
5.3 基于OpenCL的跨平台实现及性能分析
5.3.1 不同重采样方法的OpenCL实现
5.3.2 跨平台实验结果分析
5.3.3 高分辨率图像的分块优化
5.4 基于GPU阵列的多级并行实现
5.4.1 OpenMP+OpenCL实现
5.4.2 MPI+OpenCL实现
5.4.3 MPI+OpenMP+OpenCL实现
5.5 本章小结
第六章 总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
本文编号:3808290
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/3808290.html