基于多权值残差网络的服装图片检测与识别方法研究
发布时间:2025-01-04 07:14
目前大多数服装电子商务平台的服饰检索技术依然是基于关键字的搜索方式,这种技术往往不能反馈给用户喜欢的结果,而基于内容的图片检索方式又称以图搜图,会给用户搜索服装带来极大的便利。以图搜图目前存在很多问题需要解决:服装种类繁多且许多类别之间的差异很小;在使用以图搜图时,用户输入的服装图片背景复杂;大多数服装数据集存在多类数据分布不平衡,这些问题给服装分类模型的训练带来很大困扰。本文对不平衡服装数据集中的服装图片的分类和目标检测进行了研究。本文主要工作如下:(1)针对常用的浅层模型VGG16和AlexNet在多类别数据集上分类效果不佳的问题,本文构建了结构更优的残差网络ResNet-50P。该网络由三层小卷积核的残差单元模块组成,和传统两层的残差单元模块相比,计算量相同,但是可以构建更深的残差网络,模型的学习能力增强。之后在残差单元模块中使用预激活方式,对残差网络做了进一步的优化,提高了模型的准确率。(2)针对基于区域建议框的目标检测模型中存在计算量大的问题,本文在目标检测模型R-FCN的网络结构基础上设计了Light Fashion R-CNN模型。Light Fashion R-CNN模型...
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
本文编号:4023095
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图1-1本文的总体架构图
图1-1本文的总体架构图
图2-1单隐层神经网络反向传播算法在求导时采用了微积分中的链式法则,来求得一个复合函数的
图2-1单隐层神经网络向传播算法在求导时采用了微积分中的链式法则,来求得一个复合反向传播算法从目标函数开始,首先求Error对网络输出的偏导=()(
图2-2残差单元模块
图2-2残差单元模块向传播求梯度时,第i层参数w的梯度求解(+)()
图2-3两种残差单元结构图
(a)两层的残差单元模块(b)三层的残差单元模块图2-3两种残差单元结构图图2-3(b)中1×1的卷积层用于对输入特征图降维,减少计算量,而使大小的卷积层保持特征提取能力,最后再使用一个1×1的卷积层做了
本文编号:4023095
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4023095.html