基于深度神经网络与特征编码的图像分类
发布时间:2021-07-01 20:21
图像分类是计算机视觉的基础问题。随着人工智能和计算机视觉的蓬勃发展,越来越多的高校和企业投入了大量精力到图像分类研究中。顾名思义,图像分类是利用图像处理和人工智能的方法提取图像特征,然后确定图像的类别。传统的图像分类算法首先提取图像的颜色特征、纹理特征、形状特征、空间关系特征,然后训练一个分类器来对图像进行分类。传统图像分类算法的分类精度受到特征的典型性和区分性的限制。本文使用特征编码和多层空间特征金字塔来获得更全面和更具判别力的特征。本文的主要工作如下:(1)提出了一种基于深度网络高斯聚合编码的图像分类方法。首先利用深度卷积神经网络提取特征,然后将提取到的特征进行高斯聚合编码,最后将编码后的特征输入到全连接层对图像进行分类。该方法将深度学习与高斯聚合编码进行结合,使所获取的用于分类的特征有更加丰富的语义信息同时该特征具备一定的稀疏性,实验结果表明,所提出的算法具有更高的分类准确率。(2)提出了一种基于深度网络多层空间特征金字塔模型的图像分类方法。网络底层特征主要表示基础语义信息,高层特征描述的是对图像分类更具判别力的复杂语义信息,通过多层空间特征金字塔的方式将底层特征和高层特征有效融...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【图文】:
二维矩阵卷积运算示意图
西安电子科技大学硕士学位论文矩阵 C 中所有的值。卷积层的参数有权重值,步长(每次卷积运算完成向右或向下移动的步长),padding(特征图向外扩充 0 的圈数,若值为n则向外扩充n圈 0)。卷积层有两个可以大大减少参数量的方法:局部感知和权值共享。1)局部感知全局感知如图 2.2 中的图(b)所示,第 n 层的每一个神经元都和与 n+1 层的所有神经元进行连接,即第 n+1 层的每个神经元都对第 n 层的全局进行感知,这种情况下的权值数量庞大难以训练。局部感知如图 2.2 中的图(a)所示,第 n 层的每一个神经元都和第 n+1 层的部分神经元进行连接,即第 n+1 层的每个神经元都对第 n 层的局部进行感知,极大的减少了权重的数量。
图 2.3 最大池化层示意图2)平均池化层平均池化层是在一个区域内计算所有特征点的平均值,这个区域的尺寸为平的 filters 是人为设定的,还有一个步长的参数,代表每次运算完之后滑动的 2.4 是一个单通道局部平均池化的例子,池化层 filter 的大小为 2 *2,即在 2中取平均值,步长为 2,即每次向右或向下移动 2 个单位。
本文编号:3259807
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【图文】:
二维矩阵卷积运算示意图
西安电子科技大学硕士学位论文矩阵 C 中所有的值。卷积层的参数有权重值,步长(每次卷积运算完成向右或向下移动的步长),padding(特征图向外扩充 0 的圈数,若值为n则向外扩充n圈 0)。卷积层有两个可以大大减少参数量的方法:局部感知和权值共享。1)局部感知全局感知如图 2.2 中的图(b)所示,第 n 层的每一个神经元都和与 n+1 层的所有神经元进行连接,即第 n+1 层的每个神经元都对第 n 层的全局进行感知,这种情况下的权值数量庞大难以训练。局部感知如图 2.2 中的图(a)所示,第 n 层的每一个神经元都和第 n+1 层的部分神经元进行连接,即第 n+1 层的每个神经元都对第 n 层的局部进行感知,极大的减少了权重的数量。
图 2.3 最大池化层示意图2)平均池化层平均池化层是在一个区域内计算所有特征点的平均值,这个区域的尺寸为平的 filters 是人为设定的,还有一个步长的参数,代表每次运算完之后滑动的 2.4 是一个单通道局部平均池化的例子,池化层 filter 的大小为 2 *2,即在 2中取平均值,步长为 2,即每次向右或向下移动 2 个单位。
本文编号:3259807
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3259807.html