相位差算法的并行化分析与实现
本文关键词:相位差算法的并行化分析与实现
更多相关文章: 自适应光学 相位差算法 波前探测 图像复原 并行计算 傅里叶变换 光学传递函数
【摘要】:受大气湍流影响,平面波经大气传播后,振幅和相位将发生随机起伏,导致光强闪烁、波面畸变。当光进入光学系统后,光学系统自身装调误差、光学元件制造误差以及温度和重力等因素都会导致波前发生畸变。为提高成像质量,必须消除或降低大气湍流和系统自身误差的影响。为此,研究人员提出了许多方法,这些方法大体分为两类:一类是自适应光学技术,这一技术通过波前探测器对波前畸变进行探测,并实时地将探测到的波前转变为变形镜的控制信号,使波前畸变得到实时补偿。另一类方法是事后图像处理技术,该技术的核心是通过成像面的光强分布对目标进行反演,这类方法主要包括斑点成像、解卷积和盲解卷积等算法。相位差算法(Phase Diversity,PD)是一种既可以作为波前探测又可以用于事后图像复原的技术。与其他波前探测技术相比,PD算法不仅可以应用于点目标还可以应用于扩展目标,并且结构简单、不存在非共光路误差。但是,PD算法计算量大,一直以来只应用在图像事后处理领域或者与自适应光学相结合使用。近些年,随着高性能计算技术的发展,许多复杂的计算问题都得到了解决。在此基础上,本课题针对如何提高相位差算法计算速度开展如下研究:第一,对PD算法的计算过程进行分析,找到限制算法计算速度的瓶颈。从计算步骤来看,耗时最长的部分为代价函数和梯度函数的计算。从运算单元的角度来看,耗时最长的为傅里叶变换和规约求和。第二,基于GPU平台的FFT库函数CUFFT虽历经几次升级,计算效率得到大幅提升。但是,通过分析发现二维FFT计算效率仍有较大提升空间,而且针对特定应用,CUFFT库函数不能与上下文的计算合并,从而导致多次对Global Memory的访问。本文分析了合并内存事务大小与占用率之间的关系,得到了最优的线程块配置。与CUFFT 6.5相比,512×512双精度浮点复数二维FFT的效率提升了1.27倍。第三,对代价函数和梯度函数计算过程中最耗时的光学传递函数的计算进行分析,并提出了一种从波前到光学传递函数的快速计算方法,并且在GPU平台上予以实现。本文提出的方法有效地剔除了PSF和OTF计算过程中的冗余计算。针对像面为512×512像素的成像系统,本文方法比采用CUFFT库函数的方法效率提高了4.88倍。第四,在PD算法GPU实现过程中,对代价函数和梯度函数进行冗余计算的分析。PD算法计算过程中涉及到傅里叶变换,采用了两种方法,方法1采用库函数CUFFT,方法2采用本文实现的FFT函数。与方法1相比,方法2不仅通过剔除冗余计算减少了计算量,还通过上下文Kernel的合并,减少了对Global Memory的访问。实验结果表明对于像面为256×256像素、光瞳采样因子为3的成像系统,方法2比方法1计算效率提升了1.83倍。然后,在双GPU平台上对PD算法进行了合理的任务划分,方法2在双GPU上效率比单GPU提升了17%。最后,针对点目标搭建了闭环实验平台,研究了PD算法对静态像差的探测能力。实验过程中,采用He-Ne激光器和空间滤波器模拟了点目标,液晶空间光调制器(LC-SLM)除了被用于产生附加离焦像差还要作为波前校正器。实验结果表明,PD算法可以有效地对波前像差进行校正。
【关键词】:自适应光学 相位差算法 波前探测 图像复原 并行计算 傅里叶变换 光学传递函数
【学位授予单位】:电子科技大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 摘要5-7
- ABSTRACT7-12
- 第一章 绪论12-28
- 1.1 研究工作的背景与意义12-14
- 1.2 波前探测与事后图像复原概述14-21
- 1.2.1 波前探测器技术14-18
- 1.2.2 事后图像复原18-21
- 1.3 相位差算法发展现状21-23
- 1.4 CPU-GPU异构计算现状23-25
- 1.4.1 GPU硬件架构23-25
- 1.4.2 GPU软件架构发展历史25
- 1.5 本文的主要内容25-26
- 1.6 本论文的结构安排26-28
- 第二章 相位差算法理论28-45
- 2.1 基础理论28-32
- 2.1.1 成像系统基本原理28-29
- 2.1.2 像差理论29-30
- 2.1.3 光学传递函数30-32
- 2.2 相位差算法32-41
- 2.2.1 理论模型33-34
- 2.2.2 迭代算法34-35
- 2.2.3 非线性优化复原算法35-41
- 2.3 算法计算瓶颈分析41-43
- 2.3.1 最耗时的任务42-43
- 2.3.2 最耗时的运算43
- 2.4 本章小结43-45
- 第三章 傅里叶变换GPU实现45-57
- 3.1 CUDA概述45-47
- 3.1.1 软件体系架构45-46
- 3.1.2 存储器模型46
- 3.1.3 编程模型46-47
- 3.2 基于GPU的快速傅里叶变换47-50
- 3.2.1 COOLEY-TUKEY算法框架48-49
- 3.2.2 实数FFT算法49
- 3.2.3 二维傅里叶变换49-50
- 3.2.4 GPU编程原则50
- 3.3 基于GPU平台的FFT实现50-53
- 3.3.1 行方向一维FFT51-52
- 3.3.2 列方向一维FFT52-53
- 3.4 实验结果分析53-55
- 3.5 本章小结55-57
- 第四章 光学传递函数快速计算57-66
- 4.1 光瞳函数和OTF有效区的确定57-58
- 4.2 PSF中心能量区的确定58-62
- 4.3 GPU平台OTF快速计算62-64
- 4.3.1 冗余计算的剔除62-64
- 4.3.2 KERNEL融合64
- 4.4 性能比较64-65
- 4.5 本章小结65-66
- 第五章 基于GPU的相位差算法实现66-84
- 5.1 PD算法在单GPU上的实现66-78
- 5.1.1 单GPU平台任务划分66-67
- 5.1.2 代价函数和梯度函数优化策略67-75
- 5.1.3 代价函数与梯度函数实现75-76
- 5.1.4 实验结果76-78
- 5.2 相位差算法的双GPU实现78-83
- 5.2.1 多GPU平台任务划分78-80
- 5.2.2 实验结果分析80-83
- 5.3 本章小结83-84
- 第六章 相位差波前探测实验84-100
- 6.1 实验系统描述84-86
- 6.2 LC-SLM的标定与对准86-90
- 6.2.1 LC-SLM的标定86-89
- 6.2.2 LC-SLM的对准89-90
- 6.3 PD系统实验验证90-98
- 6.3.1 系统静态相差90-97
- 6.3.2 时间比较97-98
- 6.3.3 随机静态相差98
- 6.4 本章小结98-100
- 第七章 全文总结与展望100-102
- 7.1 全文总结100-101
- 7.2 后续工作展望101-102
- 致谢102-104
- 参考文献104-111
- 攻读博士学位期间取得的成果111-112
【相似文献】
中国期刊全文数据库 前10条
1 张睿;翟莹莹;谭翔;代勇;吕振辽;韩俊青;;电力交易规则算法库系统的设计与开发[J];控制工程;2013年S1期
2 王咏刚;;黑铁时代的算法“悖论"[J];程序员;2006年04期
3 樊鑫;李兴卫;;基于SCA的DBF算法可重构设计及其仿真实现[J];软件导刊;2009年11期
4 李玉梅;;按学习情境设计的数据结构算法库[J];电脑知识与技术;2011年30期
5 杜中华;狄长春;;一种基于人工神经网络和优化算法库的复杂虚拟样机优化通用方法[J];机械工程师;2009年10期
6 宋明;刘丽;;SBA中生命周期费用预测算法库的研究[J];系统仿真学报;2009年S2期
7 王宏艳;;基于可扩展算法库的多Agent社会体系结构[J];燕山大学学报;2005年06期
8 李惠君;王志宇;张芳;张毅;;基于可扩展算法库的多Agent社会体系结构[J];计算机工程与设计;2006年09期
9 张棠棣;;Z-80微型机BASIC常用算法库建库技术[J];化工自动化及仪表;1981年08期
10 赵宾宾;高慧敏;;进化算法研究平台的设计与开发[J];太原科技大学学报;2011年06期
中国博士学位论文全文数据库 前1条
1 张全;相位差算法的并行化分析与实现[D];电子科技大学;2015年
中国硕士学位论文全文数据库 前10条
1 蒋爽;面向云应用的负载预测框架[D];上海交通大学;2015年
2 陈淑珍;工业在线色谱工作站算法库的开发[D];浙江大学;2013年
3 廖晶贵;基于Hadoop的大数据关联规则挖掘算法的研究与实现[D];华南理工大学;2015年
4 王兵;密度聚类算法的研究与应用[D];西安电子科技大学;2012年
5 程进伟;滤波定位算法评估方法研究[D];上海交通大学;2013年
6 郝晓丽;信息检索系统的算法库研究[D];天津大学;2006年
7 余辉;基于Mahout的聚类算法的研究[D];上海师范大学;2014年
8 鲍宇;免费机场接送服务中基于时间优先的聚类算法研究[D];东北大学;2011年
9 谢俊凰;进化算法研究平台的设计与开发—数据处理[D];太原科技大学;2011年
10 桑波;大整数乘法算法的研究与快速实现[D];华南理工大学;2012年
,本文编号:1102828
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1102828.html