基于深度学习的服装图像检索算法研究
发布时间:2022-01-06 04:52
最近几年,服装领域电子商务蓬勃发展,互联网上的服装图像数据量与日俱增。为了处理海量的服装图像数据,有效的基于内容的服装图像检索变得异常重要。散列方法,即以二进制码表示图像,并使用汉明距离来判断相似性,因其在存储和搜索速度方面的优势而被广泛接受。受卷积神经网络(CNN)最新进展的鼓舞,本文提出了一种有效的深度学习框架,快速生成用于服装图像检索的二进制哈希码。本文提出了一种新的监督深度哈希方法,用于学习紧凑哈希码以执行基于内容的图像检索,该目标哈希码用于描述不同图像内容之间的关系。然后,目标哈希码被馈送到深度网络进行训练。针对大规模的服装图像数据库,提出了基于深度网络的服装检索模型。经过训练,我们的深度网络可以为不同内容的图像生成具有较大汉明距离的哈希码。在本文服装图像数据库上进行的实验表明,我们的方法优于其他最新方法,包括无监督,有监督和深度哈希方法。本文主要完成了以下工作:首先是构建了一套服装数据集。该服装数据集共有102000张服装图像,其中该数据集要包含服装的类别信息,服装边界框位置信息和服装掩膜信息,其中实验结果显示位置关键点信息可以克服服装光照,变形,有遮挡造成的影响,掩膜信息...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
划分区域
第二章相关理论研究11图2-1划分区域图2-2统计区域内直方图4)生成HOG特征图像梯度强度的会受到图像部分区域的光照的影响而变化,也会受到目标区域的前景-背景对比度的影响而变化,所以梯度强度极不稳定。为了解决这个不稳定的问题,有必要对梯度强度进行归一化操作。规范化进一步压缩了照明,阴影和边缘。将每个单元划分为大的,空间连接的块。以此方式,块中所有单元的特征向量被串联连接以获得块的HOG特征。假设输入图片为128×128,则该单元将具有16×16=256,并且该块将具有(16-2+1)×(16-2+1)=225,并且每个块具有36维矢量,总共225×36=8100维向量,该向量是与该图片相对应的HOG特征向量。然后,利用SVM将提取的特征向量作为人体的纹理特征输入到其中,并且进行分类和训练,最后利用训练好的模型,可以检测出图像中的人体位置区域。2.2.2Sift特征Sift特征是图像的局部特征,具有旋转不变性,尺度不变性和亮度不变性。它对于视角,光线反射和噪声的变化也具有一定的稳定性。SIFT算法的本质是在不同比例空间上找到特征点并计算特征点的方向。这些特征点非常突出,不会受到诸
电子科技大学硕士学位论文14图2-3高斯图像金字塔和高斯差分图像金字塔图2-4不同高斯核处理后的图像(2)特征点定位与过滤由于离散空间不是连续的,两个离散点之间会有一定的距离,导致真正的极值点往往不在离散的点上,下图2-5显示了二维函数离散空间得到的极值点与连续空间极值点的差别。将已知的离散空间点进行某种插值计算,然后得到的连续空间极值点的方法叫做子像素插值法。
【参考文献】:
期刊论文
[1]一种基于Local Jet 结构的全局图像特征构造方法(英文)[J]. 谢锦,蔡自兴. 自动化学报. 2014(06)
[2]全局图像特征分析与实时层次化消失点检测[J]. 孙愿,卢鸿波,张志敏. 中国图象图形学报. 2013(07)
[3]基于局部和全局特征融合的图像检索[J]. 汪华章,何小海,宰文姣. 光学精密工程. 2008(06)
本文编号:3571771
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
划分区域
第二章相关理论研究11图2-1划分区域图2-2统计区域内直方图4)生成HOG特征图像梯度强度的会受到图像部分区域的光照的影响而变化,也会受到目标区域的前景-背景对比度的影响而变化,所以梯度强度极不稳定。为了解决这个不稳定的问题,有必要对梯度强度进行归一化操作。规范化进一步压缩了照明,阴影和边缘。将每个单元划分为大的,空间连接的块。以此方式,块中所有单元的特征向量被串联连接以获得块的HOG特征。假设输入图片为128×128,则该单元将具有16×16=256,并且该块将具有(16-2+1)×(16-2+1)=225,并且每个块具有36维矢量,总共225×36=8100维向量,该向量是与该图片相对应的HOG特征向量。然后,利用SVM将提取的特征向量作为人体的纹理特征输入到其中,并且进行分类和训练,最后利用训练好的模型,可以检测出图像中的人体位置区域。2.2.2Sift特征Sift特征是图像的局部特征,具有旋转不变性,尺度不变性和亮度不变性。它对于视角,光线反射和噪声的变化也具有一定的稳定性。SIFT算法的本质是在不同比例空间上找到特征点并计算特征点的方向。这些特征点非常突出,不会受到诸
电子科技大学硕士学位论文14图2-3高斯图像金字塔和高斯差分图像金字塔图2-4不同高斯核处理后的图像(2)特征点定位与过滤由于离散空间不是连续的,两个离散点之间会有一定的距离,导致真正的极值点往往不在离散的点上,下图2-5显示了二维函数离散空间得到的极值点与连续空间极值点的差别。将已知的离散空间点进行某种插值计算,然后得到的连续空间极值点的方法叫做子像素插值法。
【参考文献】:
期刊论文
[1]一种基于Local Jet 结构的全局图像特征构造方法(英文)[J]. 谢锦,蔡自兴. 自动化学报. 2014(06)
[2]全局图像特征分析与实时层次化消失点检测[J]. 孙愿,卢鸿波,张志敏. 中国图象图形学报. 2013(07)
[3]基于局部和全局特征融合的图像检索[J]. 汪华章,何小海,宰文姣. 光学精密工程. 2008(06)
本文编号:3571771
本文链接:https://www.wllwen.com/projectlw/qgylw/3571771.html