[Abstract]:This dissertation is one of the sub-topics of "Application Research of Large Data Based on Cloud Computing" of Guangzhou Telecommunication Research Institute. It mainly studies the application of Big Data technology such as distributed storage and distributed computing in the field of data processing on clothing channel. Shopping has penetrated into people's daily life. At present, the mainstream shopping platforms mainly provide users with text retrieval mode, but because of the complex appearance of some goods and the inaccuracy of text description, the search results are often unsatisfactory, such as clothing with complex appearance. Despite a small number of platforms attempting to provide commodities that rely on image retrieval, but seriously disturbed by the background of the image, the same can not achieve better retrieval results.
Aiming at these problems, this paper proposes a retrieval model based on hot tag automatic learning for fashion channel, which belongs to the category of "search by graph". This model is based on the fact that fashion products on the Internet can get relatively satisfactory search results with only a few hot text tags. Specifically, it is By identifying the hotspot tags of fashion elements contained in the pictures submitted by users, the image set with the same hotspot tags is retrieved, and a retrieval process is completed from the graph to the hotspot tag, and then from the hotspot tag to the graph, including the training stage and the search stage. Pictures form a training set, extract the fashion element features of images, and generate a hot label classifier with SVM. In the search phase, hot labels are extracted from the submitted images, and then hot labels are used to search the merchandise stores and return the results.
The advantages of this model include two main points: first, compared with the existing visual search engine, this method is not easily disturbed by background pictures, more targeted to fashion products; second, it has a certain semantic search effect. The main contributions of this paper are as follows: Firstly, we provide a semi-annotated image database which can be used for further study, including three collar styles and three texture styles; secondly, we complete the general purpose with Nutch open source project. The third is to collect an image data set which can be used in the research of image retrieval technology with the help of Hadoop distributed technology. The fourth is to implement a prototype system which supports the method of this paper according to the requirement of software engineering.
相关期刊论文 前10条
1 丁婉莹;贺芳;冯利飞;潘婵;;标签与关键词相似度对比分析[J];情报理论与实践;2009年10期
2 陈有新;META标签的妙用[J];中国会计电算化;2001年08期
3 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期
4 林海波;赖雯;;如何利用Web2.0技术改善用户体验[J];图书馆学研究;2008年12期
5 杨军;;网上“灰色信息”的收集、开发和利用[J];青海社会科学;2006年02期
6 Hmily;IE外的新生代 4款新版浏览器热力试用[J];电脑与电信;2005年06期
7 李欣;;新一代图书馆目录系统:探索与发现/创新平台——从理论走向实践[J];图书馆杂志;2009年11期
8 倪丽萍,张维勇,金麒;XML搜索引擎技术的实现与探讨[J];合肥工业大学学报(自然科学版);2004年07期
9 梁桂英;李记旭;;Folksonomy初探[J];图书馆杂志;2006年04期
10 林芳;孟连生;;大众标注网站服务功能与运营模式分析[J];图书情报工作;2008年01期
相关会议论文 前10条
1 罗晖;;基于RFID的物业管理系统设计[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
2 杨月欣;;食品营养标签的作用和意义[A];营养与保健食品研究及科学进展学术资料汇编[C];2002年
3 李东;顾鹏;罗yN;汪锦邦;;食品的营养标签[A];未来五十年北京农业与食品业的发展研讨会论文集[C];2000年
4 杨晓强;;500例外埠食品标签项目的调查报告[A];首届全国卫生法规、标准效益评价技术研讨会暨讲习班论文汇编[C];2000年
5 池刚毅;;RFID业务在移动网络中的实现[A];2007年中国通信学会“移动增值业务与应用”学术年会论文集[C];2007年
6 龙飞;;面向RFID标签芯片的天线设计[A];2008年中国西部青年通信学术会议论文集[C];2008年
7 晋松;林鸿飞;苏绥;;基于标签共现的查询扩展研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 陈华媛;王淑艳;吴仁彪;;基于帧时隙ALOHA算法的标签估算数据分析[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
9 张陆;佐斌;;IAT在测量刻板印象中的属性类别标签效应[A];“改革开放与心理学”学术研讨会——湖北省暨武汉心理学会2008年学术年会论文集[C];2008年
10 李欣;林代茂;;一种基于标签排序的Swf文件版权保护方法[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
相关重要报纸文章 前10条
1 张珂;欧米特将创新技术带到芝加哥国际标签展[N];中国包装报;2008年
2 本报记者 刘力源;看色别标签 知老人忌口[N];文汇报;2010年
3 本报记者 成静;“信任标签”让不良网商无处藏身[N];中国经济导报;2007年
4 本报记者 王巍;深圳标签护航协议供货[N];政府采购信息报;2008年
5 钟品;贴了新标签就可网开一面?[N];中国改革报;2009年
6 李松;贺岁热:贴个标签就能热卖?[N];新华每日电讯;2004年
7 本报记者 付丽丽 实习记者 吴琼;自然标签揪住了问题食品的“尾巴”[N];大众科技报;2009年
8 张珂;防伪小标签 做出大生意[N];农民日报;2008年
9 本报记者 李丽钧;“高端”身份仅靠一纸标签明示[N];河北经济日报;2010年
10 谭俊峤;标签市场机会不少[N];中国包装报;2008年
相关博士学位论文 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
10 周