基于深度神经网络的衣服图像分类与检索
发布时间:2022-01-22 02:52
伴随着电子商务的发展,网上购物已经成为一种潮流的购物方式,衣服图像分类和检索也因此具有独特的应用前景,研究价值巨大。面对日益剧增的衣服图像数量,如何快速准确地进行图像分类和检索成为一项很有挑战性和实际意义的研究。同时,由于图像复杂背景的干扰,衣服图像的研究面临着严峻挑战。如何适当地减小背景的干扰,提高图像分类和检索的准确性,已经成为近年来的研究趋势。本文针对衣服图像处理,提出了一种新的属性分类和图像检索方法,主要完成了以下工作:首先,阐述了深度学习的基本理论知识,分析了其工作原理,并研究了相关算法及优化问题。针对衣服图像的部分属性和图像中部分区域有很强的位置对应特性,比如:袖子长度的属性由袖子的区域所决定,提出一种基于衣服图像的属性分类方法。该方法首先结合姿态估计的算法原理,确定图像中和属性相关的部分区域位置;接着利用深度神经网络模型,提取相关区域的局部特征和整幅图像的全局特征;最后融合全局特征和局部特征,作为最后的衣服图像属性的分类特征。同时,将该方法获取的融合特征和图像的单一全局特征进行对比实验,并且设计实验探究不同深度的神经网络模型对该方法的影响。实验表明,将姿态估计应用在属性分...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
最大池化图
第二章 深度学习理论分神经元的输入做出回馈。一般都是非线性函数。这是因为如果使函数,那么多层神经网络也只有线性映射能力,输出就是输入的线隐层的效果一样。激活函数必须具备可微性和单调性,因为激活函一部分,所以也是需要进行优化的,所以必须有导数。而且单调函函数,最后才可以转化为凸函数求优问题。其中最常用的激活函数igmoid 函数:函数定义如公式(2-4),图 2.4 为它的曲线图。11xye
Sigmoid 曲线图都呈现“S”型上升趋势。首先,不论输入是( 1,1)上。它在输入很大或者很小的时候,斜率比较小,会抑制 的地方斜率较大,使得神经元兴奋。它比 Sigmod 函数的优点中心对称的,所以在收敛速度上有着一定的优势,迭代次数也它也会在两端出现梯度弥散现象,使得网络的参数无法更新
【参考文献】:
期刊论文
[1]基于退火粒子群优化的单目视频人体姿态分析方法[J]. 李毅,孙正兴,陈松乐,李骞. 自动化学报. 2012(05)
[2]基于多特征的服装图像检索[J]. 侯阿临,赵柳青,桃敏,沈杨. 现代电子技术. 2010(06)
硕士论文
[1]基于深度学习的图像哈希检索[D]. 张南.天津工业大学 2017
[2]基于深度学习的服装图像分类与检索[D]. 包青平.浙江大学 2017
本文编号:3601422
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
最大池化图
第二章 深度学习理论分神经元的输入做出回馈。一般都是非线性函数。这是因为如果使函数,那么多层神经网络也只有线性映射能力,输出就是输入的线隐层的效果一样。激活函数必须具备可微性和单调性,因为激活函一部分,所以也是需要进行优化的,所以必须有导数。而且单调函函数,最后才可以转化为凸函数求优问题。其中最常用的激活函数igmoid 函数:函数定义如公式(2-4),图 2.4 为它的曲线图。11xye
Sigmoid 曲线图都呈现“S”型上升趋势。首先,不论输入是( 1,1)上。它在输入很大或者很小的时候,斜率比较小,会抑制 的地方斜率较大,使得神经元兴奋。它比 Sigmod 函数的优点中心对称的,所以在收敛速度上有着一定的优势,迭代次数也它也会在两端出现梯度弥散现象,使得网络的参数无法更新
【参考文献】:
期刊论文
[1]基于退火粒子群优化的单目视频人体姿态分析方法[J]. 李毅,孙正兴,陈松乐,李骞. 自动化学报. 2012(05)
[2]基于多特征的服装图像检索[J]. 侯阿临,赵柳青,桃敏,沈杨. 现代电子技术. 2010(06)
硕士论文
[1]基于深度学习的图像哈希检索[D]. 张南.天津工业大学 2017
[2]基于深度学习的服装图像分类与检索[D]. 包青平.浙江大学 2017
本文编号:3601422
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3601422.html
最近更新
教材专著