基于各向异性膨胀卷积的图像识别方法研究

发布时间:2021-08-25 16:24
  图像是人类获取信息的重要方式,随着社会信息化程度的日益提高,自动识别图像的需求也变得越来越迫切。由于互联网和移动互联网的快速发展,网络中图像数据呈现出爆炸式的增长,而传统模式识别方法在海量图像数据集上的识别效果无法令人满意,研究者们提出采用卷积神经网络(Convolutional Neural Network,CNN)来进行图像识别,其中,卷积是最为关键的组件。现有的卷积如普通卷积、膨胀卷积和可变形卷积,在图像识别中取得了不错的效果,但仍存在一些不足,如:普通卷积的感受野范围受到卷积核的限制,不够鲁棒;膨胀卷积会形成一个规则的感受野,不足以应付物体表观特征产生的各种变化;可变形卷积的感受野的形状的不能快速变换,不能起到精确定位目标的作用。为解决上述问题,本文对以上各种卷积进行了深入的研究,独立完成了以下工作:(1)在普通卷积、膨胀卷积和可变形卷积的基础上,提出了各向异性膨胀卷积(Anisotropic Dilated Convolution,ADC)。各向异性膨胀卷积的优势在于继承了以往普通卷积、膨胀卷积、可变形卷积的优点,是一种更加泛化的卷积形式,其他卷积可认为是各向异性膨胀卷积的一... 

【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校

【文章页数】:80 页

【学位级别】:硕士

【部分图文】:

基于各向异性膨胀卷积的图像识别方法研究


图2-1普通卷积工作方式??

特征图,卷积,工作方式


图2-2膨胀卷积工作方式??Figure?2-2?Operation?mode?of?dilated?convolution??膨胀卷积工作方式如图2-2所示,上层的是一个卷积核大小为3x3的膨胀卷积,??步长为1,膨胀率为2,下层是一个7x7大小的特征图,不进行边界填充。图(a)??到图(b)到图(c)展示了卷积的工作方式,3x3的膨胀卷积和3x3的普通卷积的??参数量是一样的,也同样是使用滑动窗口的方式进行采样,但是采样的点发生了??改变,除了卷积核的中心点,其他点相对于中心点每隔(膨胀率-1)行或列采样一??次,导致感受野的范围发生了变化。在相同的计算条件下,膨胀卷积并不会增加??模型的复杂度,却提供了更大的感受野,让每个卷积输出都包含较大范围的空间??一信息,但是要注意的是,如果要保证则输出特征图的空间尺寸与输入特征图的空??间尺寸相等的话

特征图,卷积,工作方式,特征图


图2-3可变形卷积[2()]工作方式??Figure?2-3?Operation?mode?of?deformable?convolution^20^??可变形卷积工作方式如图2-3所示,可变形卷积实际上是两个卷积层组成的,??上面的卷积是输出偏移量,下面的卷积输出特征图。定义输入特征图X和输出特??征图Y,?X的大小为CxHxW,其中C是特征图X的通道数,H和W是特征图X??的长度和宽度。可变形卷积的流程为:??(1)

【参考文献】:
期刊论文
[1]有限覆盖定理在若干数学命题证明中的应用[J]. 强华,周虎.  佳木斯大学学报(自然科学版). 2015(05)
[2]有限覆盖定理的教学研究与实践[J]. 杨小远,薛玉梅,孙玉泉,杨卓琴.  高等数学研究. 2014(01)



本文编号:3362458

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3362458.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6982a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com