面向高光谱图像异常检测的GPU加速器设计

发布时间：2020-10-29 07:20

　　堆叠自编码器(Stacked Autoencoder,SAE)作为一种非监督深度学习方法,以其优秀的非线性拟合能力在高光谱图像异常检测应用研究中获得较好检测精度。然而SAE庞大的计算量带来长计算耗时成为其在高光谱图像异常检测实际应用的主要瓶颈。为解决该问题,依托目前高性能计算主流处理器平台GPU(Grapgic Processing Unit)的大规模并行计算能力和高访存带宽的优势,开展面向高光谱图像异常检测的GPU加速器设计。课题工作可为高光谱图像异常目标实时检测方法的应用提供一种可行的解决方案,同时也可为其他机器学习算法的GPU加速器设计提供参考。本课题从SAE模型训练和模型推理两个过程开展工作,针对模型训练过程计算量大和计算耗时长的问题,采用GPU服务器开展训练加速器的设计;针对算法推理过程低延迟的需求,以及计算平台体积和功耗受限的矛盾,采用嵌入式GPU开展推理加速器的设计。论文的主要工作包括以下内容:首先,对基于SAE的高光谱图像异常检测的原理进行分析,设计基于SAE的检测器,并采用两幅真实高光谱图像数据进行模型的性能验证,其AUC值分别可达0.8569和0.9248,优于基准检测器RXD,表明了本文设计基于SAE的高光谱图像异常检测器的合理性和正确性。其次,针对基于SAE的高光谱图像异常检测模型训练过程计算量庞大和耗时长的问题,开展基于CPU+GPU异构系统的训练加速器的设计。为提高计算效率,采用主机计算和设备计算重叠、数据传输和设备计算重叠、设备计算和设备计算重叠三种策略实现粗粒度并行计算。基于真实高光谱图像数据的计算效率测试实验结果表明:本文提出的GPU训练加速器在模型最快收敛速度情况下相比于单核CPU可达到27倍加速,具有显著的加速效果。最后,针对高光谱图像异常检测过程的实时性需求与计算平台体积功耗约束之间的矛盾问题,开展基于嵌入式GPU计算平台的推理加速器设计。通过模型计算图化简及GPU核函数合并的设计降低计算延迟。基于真实高光谱图像数据进行计算效率和功耗的综合实验结果表明:本文所提出的推理加速器的相比于ARM处理器最高可以获得157倍加速比和113倍的能效比,相比于八核DSP最高可以获得71倍的加速比和119倍的能效比。
【学位单位】：哈尔滨工业大学
【学位级别】：硕士
【学位年份】：2018
【中图分类】：TP751
【部分图文】：

高光谱图像,目标检测器,计算过程

输入图像重建图像二值化后的重建误差图 2-1 SAE 异常目标检测器计算过程基于 SAE 的高光谱图像异常检测在进行异常目标检测之前需要利用高光像数据进行 SAE 模型参数优化以及超参数的寻优，在下文中对 SAE 的基本、模型参数优化以及超参数寻优过程进行介绍。.2.1 SAE 的原理SAE 是由自编码器（Autoencoder，AE）演化而来，SAE 是由多个 AE 组成，故本小节将介绍一下 AE 的原理。AE 是一种单隐藏层的神经网络模型络呈对称结构，如图 2-2 所示。AE 由一个编码器和一个解码器组合而成。器将输入数据转换成一种不同的表示，而解码器将这个新的表示转换到原形式。AE的目的是期望输入数据经过编码器和解码器之后尽可能多被重建 AE 组合而成的 SAE 同样具备对输入数据进行重建的能力。本课题基于 S高光谱图像异常检测的主要思想就是希望 SAE 的输出能够尽可能多地对背元进行重建。

网络结构图,自编码,网络结构,超参数

图 2-1 SAE 异常目标检测器计算过程谱图像异常检测在进行异常目标检测型参数优化以及超参数的寻优，在下文及超参数寻优过程进行介绍。器（Autoencoder，AE）演化而来，SA绍一下 AE 的原理。AE 是一种单隐藏图 2-2 所示。AE 由一个编码器和一个成一种不同的表示，而解码器将这个期望输入数据经过编码器和解码器之E 同样具备对输入数据进行重建的能测的主要思想就是希望 SAE 的输出能z重建数据

高光谱图像,隐藏层

( )z z=z δW y + b中 y 为解码器的输入，zW 为解码器的权重，zb 为编码器的偏置，活函数， z 为解码器的输出且是整个自编码器的输出。首先，将作为解码器的输入和解码器的权重zW 进行矩阵乘法运算；然后将的结果和解码器的偏置zb 进行矩阵加法；最后将矩阵加法的结果函数δ 进行非线性变化得到解码器每一个神经元的输出，同时也输出。E 是仅包含一层隐藏层的全连接神经网络，对于高光谱图像光谱信征的表达能力十分有限。深度神经网络包含了三层或三层以上的够提取更为复杂的输入特征，SAE 就是一个包含三层或三层及以经网络。SAE 是由输入层和多个 AE 的隐藏层依次连接构成的深随着网络隐藏层层数的增加，网络能够以更加紧凑简洁的方式来像像元的光谱信息之间的非线性关系，一个具有 3 层隐藏层的 S-3 所示：输入层隐藏层0 隐藏层1 隐藏层2 输出层
【参考文献】

相关期刊论文前4条

1 韩继国;;摩尔定律失效后的芯片走向[J];集成电路应用;2015年10期

2 董代洁;全成斌;田淑珍;赵有健;;微型计算机系统接口技术课程实验探索[J];计算机教育;2013年18期

3 徐卫志;宋风龙;刘志勇;范东睿;余磊;张帅;;众核处理器片上同步机制和评估方法研究[J];计算机学报;2010年10期

4 贺霖;潘泉;邸韡;李远清;;高光谱图像目标检测研究进展[J];电子学报;2009年09期

相关博士学位论文前2条

1 张涛;高性能低能耗GPGPU计算技术研究[D];上海交通大学;2015年

2 梅锋;基于核机器学习的高光谱异常目标检测算法研究[D];哈尔滨工程大学;2009年

相关硕士学位论文前6条

1 陈宇佳;高光谱遥感影像亚像元定位技术研究[D];中国地质大学(北京);2017年

2 赵洋洋;基于FPGA的深度信念网络加速系统研究[D];中国科学技术大学;2017年

3 彭倩;基于非负矩阵分解的高光谱图像解混研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2017年

4 罗建华;深度学习在高光谱图像的降维及分类中的应用[D];电子科技大学;2017年

5 武继瑞;图像增强在FPGA上的高性能实现[D];中国科学院研究生院(光电技术研究所);2016年

6 王晓璐;基于Zynq的LS-SVM算法加速器设计[D];哈尔滨工业大学;2015年

本文编号：2860573

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/guanlilunwen/gongchengguanli/2860573.html

上一篇：高速合作目标水下定位关键技术研究
下一篇：多波段太赫兹超材料增透膜的设计及特性分析

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|