当前位置:主页 > 科技论文 > 搜索引擎论文 >

面向移动终端的衣服搜索算法研究

发布时间:2024-02-27 23:41
  在传统的线上衣服购物场景中,用户在搜索商品时需要输入关于衣服商品的特征描述关键字。由于关键字描述能力的局限性,这种方式下系统搜索到的商品往往和消费者的意图不匹配,而且关键字输入也给用户体验带来不好的影响。特别是在移动互联网的场景下,移动终端能够很方便获得期望商品的外观图像。如果系统能够直接根据移动终端获取的图像完成搜索,做到所见即所得,则无疑会给线上购物带来巨大的便捷。基于以上的应用背景,本文开展了基于移动终端的衣服图像搜索算法设计与应用开发研究。针对移动搜索系统的能耗限制和网络传输时延以及搜索精度和速度问题,主要完成了以下工作:首先采用视觉词汇树来提高单词量化效率,视觉词汇树通过将视觉词典组织成树状结构将量化的计算复杂度降低到对数级别,以降低移动端量化过程的能耗。同时,利用衣服图像的视觉单词向量的稀疏性特点,降低系统的网络传输负载,提高系统响应速度。针对搜索精度和速度,本文基于乘积量化思想提出融合衣服图像的纹理和颜色视觉词典的融合索引搜索算法提高搜索系统的搜索性能。由于算法中衣服图像的视觉词典是通过对两种视觉词典进行笛卡尔乘积得到,它通过两个规模较小的视觉词典构造得到单词空间较大的融...

【文章页数】:84 页

【学位级别】:硕士

【部分图文】:

图2–3SIFT特征向量生成示例

图2–3SIFT特征向量生成示例

图像的深度特征之后就可以通过比较深度特征向量之间的余弦相似度来判断对应的两幅图像的相似程度了。AlexNet的网络结构如图2–4所示。它由5个卷积层,4个pooling和三个全连接层组成的深度卷积神经网络(CNN)。FC6层的激活输出是4096维的向量,也就是....


图2–4AlexNet深度卷积网络结构

图2–4AlexNet深度卷积网络结构

图像的深度特征之后就可以通过比较深度特征向量之间的余弦相似度来判断对应的两幅图像的相似程度了。AlexNet的网络结构如图2–4所示。它由5个卷积层,4个pooling和三个全连接层组成的深度卷积神经网络(CNN)。FC6层的激活输出是4096维的向量,也就是....


图2–7图像二进制表达的深度神经网络结构

图2–7图像二进制表达的深度神经网络结构

[51]。提取图像二值特征表达的卷积神经网络结构如图2–7所示。该网络由3个卷积-pooling层和两个全连接层组成。根据之前的阐述,得到的二值向量要保持原有特征空间的结构,因此网络对应的损失函数定义为:L(b1,b2,y)=12(1y)Dh(b1,b2)+12....


图3–1HSV颜色空间量化示意图

图3–1HSV颜色空间量化示意图

间(H表示的是颜色的色调,S表示的是颜色的饱和度,V表示的颜色的明度)相比数字图像的RGB空间更适合人眼对色彩的描述,因此本文选择在HSV颜色空间来对衣服图像进行颜色特征提取。如图3–1所示,首先对HSV颜色空间进行等间隔量化,然后简单通过统计衣服图像各区域....



本文编号:3913143

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3913143.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户de2d1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com