快速鲁棒的图像语义分割算法研究
发布时间:2020-10-30 07:48
图像语义分割与场景理解是计算机视觉的核心问题之一,旨在对图像的每个像素根据已知的类别集合进行分类。在自动驾驶、自拍肖像画、增强现实等诸多应用场景下,高效而精确的场景理解算法不可或缺。因此,如何实现快速鲁棒的图像语义分割算法越来越受到人们的关注,这也是计算机视觉研究要实现完全地理解场景的主要问题。在最近几年中,研究者们已经提出了许多不同的算法用以解决该问题,其中包括利用传统的机器学习方法和图像特征技术,以及最近被广泛采用的深度学习方法。本文基于不同的技术基础和应用场景提出了三种不同的图像语义分割算法。具体地:首先,本文提出了一种基于标签传输的图像语义分割算法。该算法通过搜索查询图像的近邻已标注图像来获得语义分割结果。本文的主要工作是优化近邻已标注图像的搜索精度和速度,并提出了一种称为稀疏乘积量化(sparse product quantization)的近似最近邻搜索算法。通过结合软分配的思想以及乘积量化的策略,本文提出的方法不仅能够达到更低的量化误差下限从而能够得到更精确的近似结果,而且还可以减少搜索的计算代价。为了展示算法的准确度和效率,本文不仅在多个近邻搜索数据集上评测了算法的近似搜索性能,并且在语义分割数据集上验证了该算法应用在基于标签传输的图像语义分割上的有效性。其次,本文提出了一种基于图像集的协同分割算法。为了提高分割算法的鲁棒性,本文引入了一个称为注意力(attentiveness)的度量值。与其他方法相比,通过计算图像中所有对象的注意力值,算法可以在含有噪声图像集合上有效地进行协同分割。此外,为了实现协同分割图像集包含更加相似的目标前景,本文进一步地在图像集上采用了子类聚类。对于理想的协同分割图像集,本文提出了一种结合局部形状先验和全局形状先验的协同分割算法。通过求解能量最小化问题并利用初始的分割结果来迭代更新形状先验,协同分割的结果得到进一步提升。本文在多个数据集进行实验并验证了我们提出的算法的鲁棒性。最后,本文介绍了一种基于深度学习的快速图像语义分割算法。虽然基于卷积神经网络的许多方法都取得了显著的分割效果,但由于大网络结构昂贵的计算开销,这些方法仍然存在着处理速度较慢的问题。我们通过在小网络上构建算法,并结合两个新提出的模块来改进分割算法从而避免计算开销过大的问题。我们提出的第一个模块称为层次带孔模块,其由多层次的带孔卷积层结构组成并能够直接进行多尺度特征处理。第二个模块被称为特征提炼模块,其作用是精化由于网络的池化操作而变粗糙并丢失空间细节的特征。该模块主要通过利用跳转结构和辅助损失计算来实现。本文最后的实验结果表明,我们提出的方法比目前最快的图像语义分割算法速度快两倍,并且取得更好的分割效果。
【学位单位】:浙江大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:TP391.41
【部分图文】:
::':參.,,:??图1.1?Daimler数据集城市场景示例⑴??趣的区域,以便对图像进行后续的分析和理解。图1.1展示了早期评估语义分割算??法的Daimler数据集W的图片示例,而图1.2则是当前较热门的Cityscapes数据??集11。这些图片主要是一些城市的街道场景,在这些数据集上语义分割算法不但??需要识别出道路、建筑、天空等静态的大区域,还需要别行人、车辆、交通灯??等动态的物体。??另一方面,随着智能手机等移动端设备近些年的快速发展,移动端设备越来??越计算能力越来越强已经运行的软件越来越智能。而伴随着图像语义分割技术的??曰渐成熟,当前也产生了越来越多的面向普通消费用户的智能移动端产品。例如,??智能背景替换即其中一项面向娱乐的应用。现在许多流行的拍照美化软件或应用??均提供了该项功能,而其背后的技术就是图像语义分割。另一个具有相功能但??是应用场景完全不同且非常实用的例子是智能证件照。智能证件照也是基于人像??分割的功能来实现的,然而其应用却将会给我们的生活带来了便利。图1.3展示??了基于本文提出的语义分割算法得到的一个初步的证件照的示例。可以看到
:::':參.,,:??图1.1?Daimler数据集城市场景示例⑴??趣的区域,以便对图像进行后续的分析和理解。图1.1展示了早期评估语义分割算??法的Daimler数据集W的图片示例,而图1.2则是当前较热门的Cityscapes数据??集11。这些图片主要是一些城市的街道场景,在这些数据集上语义分割算法不但??需要识别出道路、建筑、天空等静态的大区域,还需要别行人、车辆、交通灯??等动态的物体。??另一方面,随着智能手机等移动端设备近些年的快速发展,移动端设备越来??越计算能力越来越强已经运行的软件越来越智能。而伴随着图像语义分割技术的??曰渐成熟,当前也产生了越来越多的面向普通消费用户的智能移动端产品。例如,??智能背景替换即其中一项面向娱乐的应用。现在许多流行的拍照美化软件或应用??均提供了该项功能,而其背后的技术就是图像语义分割。另一个具有相功能但??是应用场景完全不同且非常实用的例子是智能证件照。智能证件照也是基于人像??分割的功能来实现的
?第1章绪论??图1.2?Cityscapes数据集城市场景示例M??觉领域的一个核心问题,其算法的研究开发与成熟也将在未来改变我们的生活方??式。??1.2国内外的研究现状与发展趋势??图像语义分割是计算机视觉的关键问题,早期许多方法将该问题称为场景理??解并将其建模成马尔科夫随机场(Markov?random?field,?MRF),然后通过求解能??量最小化问题得到分割的结果。Wang等人M提供了一个在计算机视觉和图像??理解问题上应用MRF的全面调查。随着深度学习技术的快速发展,作为深度学??习热门技术的卷积神经网络被应用到求解图像语义分割的问题上,并取得了非常??好的结果。接下来我们将首先介绍传统的语义分割方法,然后再介绍最近基于深??度学习的先进图像语义分割方法。??3??
【参考文献】
本文编号:2862209
【学位单位】:浙江大学
【学位级别】:博士
【学位年份】:2018
【中图分类】:TP391.41
【部分图文】:
::':參.,,:??图1.1?Daimler数据集城市场景示例⑴??趣的区域,以便对图像进行后续的分析和理解。图1.1展示了早期评估语义分割算??法的Daimler数据集W的图片示例,而图1.2则是当前较热门的Cityscapes数据??集11。这些图片主要是一些城市的街道场景,在这些数据集上语义分割算法不但??需要识别出道路、建筑、天空等静态的大区域,还需要别行人、车辆、交通灯??等动态的物体。??另一方面,随着智能手机等移动端设备近些年的快速发展,移动端设备越来??越计算能力越来越强已经运行的软件越来越智能。而伴随着图像语义分割技术的??曰渐成熟,当前也产生了越来越多的面向普通消费用户的智能移动端产品。例如,??智能背景替换即其中一项面向娱乐的应用。现在许多流行的拍照美化软件或应用??均提供了该项功能,而其背后的技术就是图像语义分割。另一个具有相功能但??是应用场景完全不同且非常实用的例子是智能证件照。智能证件照也是基于人像??分割的功能来实现的,然而其应用却将会给我们的生活带来了便利。图1.3展示??了基于本文提出的语义分割算法得到的一个初步的证件照的示例。可以看到
:::':參.,,:??图1.1?Daimler数据集城市场景示例⑴??趣的区域,以便对图像进行后续的分析和理解。图1.1展示了早期评估语义分割算??法的Daimler数据集W的图片示例,而图1.2则是当前较热门的Cityscapes数据??集11。这些图片主要是一些城市的街道场景,在这些数据集上语义分割算法不但??需要识别出道路、建筑、天空等静态的大区域,还需要别行人、车辆、交通灯??等动态的物体。??另一方面,随着智能手机等移动端设备近些年的快速发展,移动端设备越来??越计算能力越来越强已经运行的软件越来越智能。而伴随着图像语义分割技术的??曰渐成熟,当前也产生了越来越多的面向普通消费用户的智能移动端产品。例如,??智能背景替换即其中一项面向娱乐的应用。现在许多流行的拍照美化软件或应用??均提供了该项功能,而其背后的技术就是图像语义分割。另一个具有相功能但??是应用场景完全不同且非常实用的例子是智能证件照。智能证件照也是基于人像??分割的功能来实现的
?第1章绪论??图1.2?Cityscapes数据集城市场景示例M??觉领域的一个核心问题,其算法的研究开发与成熟也将在未来改变我们的生活方??式。??1.2国内外的研究现状与发展趋势??图像语义分割是计算机视觉的关键问题,早期许多方法将该问题称为场景理??解并将其建模成马尔科夫随机场(Markov?random?field,?MRF),然后通过求解能??量最小化问题得到分割的结果。Wang等人M提供了一个在计算机视觉和图像??理解问题上应用MRF的全面调查。随着深度学习技术的快速发展,作为深度学??习热门技术的卷积神经网络被应用到求解图像语义分割的问题上,并取得了非常??好的结果。接下来我们将首先介绍传统的语义分割方法,然后再介绍最近基于深??度学习的先进图像语义分割方法。??3??
【参考文献】
相关期刊论文 前1条
1 张浩;窦奇伟;栾桂凯;姚绍文;周维;;基于空洞卷积的快速背景自动更换[J];计算机应用;2018年02期
本文编号:2862209
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2862209.html