基于GPU的实时部分相干光并行生成算法研究
发布时间:2017-10-30 16:24
本文关键词:基于GPU的实时部分相干光并行生成算法研究
更多相关文章: CUDA GPU 并行计算 空间光调制器 部分相干光
【摘要】:无线激光通讯中,高相干性的激光光束更容易受大气的影响,降低了通讯系统的性能。最新理论与实验研究表明部分相干光束受湍流影响较小。针对利用液晶空间光调制器(LC SLM)实时、便捷生成部分相干光,采用了一种基于GPU并行加速的方法,全文主要包括四个部分。第一部分主要分析了CUDA架构GPU的硬件设计架构、存储器组织模型、线程结构、软件体系架构以及编程模型。第二部分引入部分相干光的基本概念,并从空间-时间域和空间-频率域内对一般部分相干的理论进行研究。介绍了分别采用毛玻璃和液晶空间光调制器实验生成部分相干光的原理。第三部分液晶空间光调制器法中生成特定相干度的相位掩膜时需进行二维卷积运算。本文研究了卷积在CUDA平台上并行优化实现,即基于共享内存的分离卷积计算方式与基于CUFFT库的卷积计算方式。为比较GPU并行优化后的性能,在CPU上同样实现两种算法,实验结果表明:基于FFT的卷积计算在GPU加速后性能可提升30至45倍,而可分离卷积并行优化后的性能可提升12至24倍。第四部分搭建实时生成部分相干光与相干长度检测实验装置,验证生成部分相干光满足实时性与相干长度准确性的要求。实验结果表明:针对256×256像素的LC SLM,生成相干长度为0.15mm、0.9mm以及1.5mm的相位屏,GPU所用时间分别为0.95ms、2.2ms以及2.8ms;考虑CPU读取、发送数据及液晶响应的时间,采用GPU并行加速的部分相干光实时生成方法的频率可达150Hz。生成相干长度为0.15mm和1.5mm部分相干光束,光束相干度均方根误差分别为0.022011和0.020883,峰谷值分别为0.074325和0.072998。所以该方法满足实时性与准确生成定相干长度要求。
【关键词】:CUDA GPU 并行计算 空间光调制器 部分相干光
【学位授予单位】:长春理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN929.1
【目录】:
- 摘要4-5
- ABSTRACT5-8
- 第一章 绪论8-14
- 1.1 研究背景及目的意义8-9
- 1.2 基于GPU的通用计算发展动态9-11
- 1.2.1 GPU体系架构的发展动态9-10
- 1.2.2 GPU编程模型的发展动态10-11
- 1.3 部分相干光研究现状11-13
- 1.4 文主要研究内容及结构安排13-14
- 第二章 CUDA硬件架构及其编程模型14-23
- 2.1 引言14
- 2.2 CUDA硬件架构14-17
- 2.3 CUDA存储器模型17-19
- 2.4 CUDA编程模型19-22
- 2.4.1 CUDA编程结构19-20
- 2.4.2 CUDA线程结构20-22
- 2.5 本章小结22-23
- 第三章 部分相干光基本理论及实验生成23-29
- 3.1 引言23
- 3.2 部分相干光基本理论23-25
- 3.2.1 空间-时间域23-24
- 3.2.2 空间-频率域24-25
- 3.2.3 高斯谢尔模(GSM)光束25
- 3.3 部分相干光实验生成25-28
- 3.3.1 毛玻璃法25-26
- 3.3.2 液晶空间光调制器法26-28
- 3.4 本章小结28-29
- 第四章 基于CUDA的卷积算法并行优化设计29-42
- 4.1 引言29
- 4.2 可分离卷积优化算法29-33
- 4.2.1 算法描述29-30
- 4.2.2 基于CUDA的可分离卷积并行优化30-33
- 4.3 基于FFT的卷积优化算法33-38
- 4.3.1 算法描述33-36
- 4.3.2 基于CUFFT库的卷积并行优化36-38
- 4.4 性能对比与分析38-40
- 4.4.1 测试平台38
- 4.4.2 性能测试与对比分析38-40
- 4.5 本章小结40-42
- 第五章 部分相干光实时生成实验研究42-48
- 5.1 引言42
- 5.2 实验系统平台42-44
- 5.2.1 实验原理42
- 5.2.2 实验平台搭建42-44
- 5.3 实验结果分析44-47
- 5.3.1 部分相干光生成实时性分析44-46
- 5.3.2 部分相干光生成相干长度分析46-47
- 5.4 本章小结47-48
- 第六章 总结与展望48-49
- 致谢49-50
- 参考文献50-53
- 作者简介53
本文编号:1118422
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1118422.html