面向图像识别的深度卷积网络结构研究

发布时间:2022-09-28 19:13
  近年来,深度学习及相关方法已经在计算机视觉研究领域占据了统治地位。随着GPU等高速计算处理硬件的逐步普及,在计算量得到保证的情况下,设计包含更多层数的卷积神经网络模型可以简单有效地大幅提升各种计算机视觉任务的精确度。然而,简单地增加网络层数存在一些明显的问题。首先,模型的精确度随着层数增加到一定程度后达到稳定,无法进一步上升甚至不升反降。这种现象称为模型退化(Degradation)。堆叠卷积层并不能增加模型学习到的非线性项,所以并不利于复杂问题中的特征分布拟合。其次,层数的增加带来了参数与计算量的大幅增加,导致模型训练时间大幅上升,不利于实际问题中的模型应用。可以看出,卷积神经网络结构设计尚存在较大的研究空间。受到将单支神经网络改进为多支网络的启发,我们将神经网络中的每一个卷积层都改进为一个由并行的两分支组成的二阶响应变换(Second-Order Response Transform,SORT)模块。在传统的两分支神经网络对于分支输出求和的基础上,我们增加了按位求乘积的操作,使得最终传递的响应同时包含一阶项和二阶项。二阶响应变换的一大优势是可以促进网络中不同分支间的响应的共享和传播... 

【文章页数】:93 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 研究背景及意义
        1.1.1 图像模式识别
        1.1.2 深度卷积神经网络
        1.1.3 卷积神经网络改进
    1.2 本文的主要研究内容与创新成果
    1.3 本文的结构安排
第二章 卷积神经网络结构演变
    2.1 卷积神经网络
        2.1.1 GoogLeNet与 Inception模块
        2.1.2 由Highway网络到残差神经网络
        2.1.3 多支网络结构的近期发展
        2.1.4 双线性神经网络(Bilinear CNN)
    2.2 本章小结
第三章 二阶响应变换
    3.1 研究背景:多分支网络连接方法
    3.2 二阶响应变换模块
        3.2.1 结构简述
        3.2.2 分支间的响应传播
        3.2.3 网络中的非线性
        3.2.4 与其他研究工作的关系
    3.3 小规模图片数据集上的实验
        3.3.1 实验环境
        3.3.2 实验模型
        3.3.3 实验结果
        3.3.4 实验结果分析与讨论
    3.4 大规模图片数据集上的实验
        3.4.1 实验环境
        3.4.2 实验结果
        3.4.3 实验结果讨论与分析
    3.5 迁移学习
    3.6 本章小结
第四章 多尺度空间不对称校正
    4.1 研究背景:注意力模型
    4.2 多尺度空间不对称校正模块
        4.2.1 卷积网络与空间不对称性
        4.2.2 空间不对称重标定
        4.2.3 多尺度空间不对称重标定
        4.2.4 多种卷积神经网络上的重标定模型设计
        4.2.5 模型计算量
    4.3 CIFAR数据集上的实验
        4.3.1 实验环境
        4.3.2 实验结果与分析
    4.4 消融实验与分析
    4.5 ILSVRC2012 数据集上的实验
        4.5.1 实验环境
        4.5.2 实验结果与分析
    4.6 本章小结
第五章 全文总结与研究展望
    5.1 全文总结
    5.2 研究展望
参考文献
致谢
攻读学位期间发表的学术论文



本文编号:3682228

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3682228.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c3389***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com