GPU并行计算及其在光声图像重建中的应用
发布时间:2023-04-01 22:14
随着GPU计算时代的到来,大量并行性的程序越来越多地使用GPU的并行计算能力来获得更高的性能和效率。如今,GPU并行计算使以前认为由于执行时间长而无法实现的程序成为可能。压缩感知光声计算机层析成像(compressed sensing-photoacoustic computed tomography,CS-PACT)是一种常用的医学图像重建方法,可以在稀疏采样的情况下生成高质量的图像。然而,由于CS-PACT是一个需要几十到几百次迭代的重建过程,计算复杂度高,使得图像重建过程非常慢。因此,为了提高图像重建速度,本文将GPU应用到光声图像重建中,重点探索了CS-PACT算法的GPU并行计算框架和计算方法。本文的主要研究内容如下:(1)小图像尺寸下的GPU并行计算模型和方法。本文提出了迭代重建算法的GPU并行计算架构,主要是提取了5类主要的并行化算子,然后对其进行并行设计,并运用优化方法对其优化。最后通过两个不同的人手数据(128*128,256*128)进行定性与定量分析,来证明GPU重建图像的准确性。对于128*128(像素)人手1的B-scan光声图像实现了1.9-2.5s的图像重...
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 技术路线
1.4 论文组织结构
第2章 GPU并行计算和CUDA编程
2.1 GPU运算优势
2.2 GPU体系架构
2.3 CUDA编程基础
2.3.1 CUDA软件体系结构
2.3.2 CUDA编程模型
2.3.3 CUDA存储模型
2.3.4 CUDA分析工具
第3章 光声成像及重建算法
3.1 光声成像
3.2 传统反投影重建算法
3.3 基于模型的压缩感知重建
第4章 小图像尺寸下的GPU并行计算模型和方法
4.1 压缩感知-光声层析成像并行框架
4.2 核函数
4.2.1 矩阵乘法
4.2.2 矩阵转置
4.2.3 矩阵中最大值
4.2.4 矩阵按行乘累加
4.2.5 矩阵向量乘法
4.3 活体实验验证
4.3.1 高频阵列光声成像系统
4.3.2 实验结果
4.4 本章小结
第5章 大图像尺寸下的GPU并行计算模型和方法
5.1 CUDA流
5.2 基于CUDA流的并行计算框架
5.3 仿体插针实验
5.3.1 低频阵列光声成像系统
5.3.2 实验结果
5.4 小老鼠实验
5.5 本章小结
第6章 总结与展望
6.1 论文总结
6.2 论文展望
参考文献
致谢
在校期间发表的学术论文
本文编号:3777958
【文章页数】:52 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 技术路线
1.4 论文组织结构
第2章 GPU并行计算和CUDA编程
2.1 GPU运算优势
2.2 GPU体系架构
2.3 CUDA编程基础
2.3.1 CUDA软件体系结构
2.3.2 CUDA编程模型
2.3.3 CUDA存储模型
2.3.4 CUDA分析工具
第3章 光声成像及重建算法
3.1 光声成像
3.2 传统反投影重建算法
3.3 基于模型的压缩感知重建
第4章 小图像尺寸下的GPU并行计算模型和方法
4.1 压缩感知-光声层析成像并行框架
4.2 核函数
4.2.1 矩阵乘法
4.2.2 矩阵转置
4.2.3 矩阵中最大值
4.2.4 矩阵按行乘累加
4.2.5 矩阵向量乘法
4.3 活体实验验证
4.3.1 高频阵列光声成像系统
4.3.2 实验结果
4.4 本章小结
第5章 大图像尺寸下的GPU并行计算模型和方法
5.1 CUDA流
5.2 基于CUDA流的并行计算框架
5.3 仿体插针实验
5.3.1 低频阵列光声成像系统
5.3.2 实验结果
5.4 小老鼠实验
5.5 本章小结
第6章 总结与展望
6.1 论文总结
6.2 论文展望
参考文献
致谢
在校期间发表的学术论文
本文编号:3777958
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3777958.html
最近更新
教材专著