基于多支路卷积网络的图像识别和语义分割研究

发布时间:2024-07-07 01:54
  随着近几年的发展,深度学习方法在许多人工智能应用领域取得了极大的突破,例如计算机视觉和自然语言处理。其中在计算机视觉领域,不同于传统方法依赖的手工特征提取,深度学习由于其端到端训练的特点,和优越的特征提取性能,近几年以卷积神经网络为代表的深度学习方法几乎在所有计算机视觉子领域都取得了重大突破,极大地推进了这些研究领域的发展。在本文中,基于卷积神经网络,我们将聚焦计算机视觉领域中两个重要任务:图像识别和语义分割。其中图像识别(图像分类)是所有计算机视觉任务的基础。使用卷积神经网络的图像分类方法首先学习关于输入图像的层级特征表达,然后根据这些特征进行分类。图像分类的核心是特征学习过程,同时这也是所有其他计算机视觉任务的基础。设计一个性能优异的卷积网路结构是所有这类方法的关键。而语义分割,则是实现图像理解、图像编辑与机器人环境感知的基础。语义分割是一个密集的像素分类问题,所以其可以看成一种高层次更加精细化的图像分类问题。本文首先分析了现有基于卷积网络的图像分类方法,然后提出了一种基于多支路并行卷积神经网络和判别器网络的图像识别网络架构,其可以使用任意现有卷积神经网络模型进行构建,并且采用一种...

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

图2.1VGG16在图像分类上的可视化效果

图2.1VGG16在图像分类上的可视化效果

图像分类任务是卷积神经网络(CNN)最直接的应用,由于几乎所有其它的计算机视觉任务都是以图像分类作为基础的,所以提高卷积神经网络的特征表达能力是极其重要的研究课题。本章提出了一个简单但十分高效的并行卷积神经网络框架,该框架借鉴了对抗学习的思想,通过引入一个判别器网络,使用一种新颖....


图2.2典型生成对抗网络示意图

图2.2典型生成对抗网络示意图

图2.2典型生成对抗网络示意图随着这几年生成对抗网络领域的研究的发展,其已经广泛的应用于各种觉任务,并不仅仅局限于图像生成,例如风格迁移,目标检测,语义分割再识别。D-PCN方法


图2.3D-PCN结构示意图

图2.3D-PCN结构示意图

图2.3D-PCN结构示意图在D-PCN中,有多个并行的卷积神经网络(如果未作特殊说明,下文的D-PCN皆只有2个结构相同的并行网络),一个判别器,以及一个额外的分类网络,整体结构如图2.3。两个子网络的分类器仅仅是为了训练过程中产生误差值进行参数更新,在预测阶....


图2.4基于ResNet-20的D-PCN结构

图2.4基于ResNet-20的D-PCN结构

华中科技大学硕士学位论文公式(2.3)中的12分别指代两个子网络的特征提取器,其作用类似于生成对抗网络中的生成器,1()2()分别指代特征提取器学习到的特征。在公式(2.3中,不同于生成对抗网络中最小化max,我们实质是最大....



本文编号:4002973

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4002973.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户74185***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com