面向网购平台的商品图像类别预测方法
本文关键词:面向网购平台的商品图像类别预测方法,由笔耕文化传播整理发布。
【摘要】:近年来,网购平台(如亚马逊,淘宝等)蓬勃发展,大量互联网用户选择在线网购作为重要的购物方式。网购平台为提升用户购物体验,将图像作为商品展示中不可缺少的一部分。这同时也为网购平台成功积累大量的商品图像。网购平台中海量商品图像的出现,为更好地组织、检索和查看商品创造可能。例如,用户可以通过一幅简单图像,查找相关的商品。然而,这并不是一项简单的工作,因为低层次的视觉特征和真实世界的商品之间有着巨大的区别。因此,如何预测一幅图像中商品的类别,成为一个重要的问题。事实上,商品图像类别预测基于图像分类的方法。但与传统的图像分类应用相比,商品图像类别预测问题不但需要利用海量社会化标注的图像,更需要对现实世界中商品的海量类别进行预测。本文为构建一种完整的商品图像类别预测方法,提出数个具有良好扩展性、适用于大数据处理的算法和模型。在这种自动化方法中,利用易于从互联网获得的社会化标注图像是基础。然而,这些数据中图像与他们类别标签间的关系存在不确定性,这导致从图像搜索引擎获得的图像中总有不相关图像存在。过滤这些不相关的图像是一个大规模数据的单类别预测问题。为解决该问题,本文采用一种基于图分割和KNN分类算法的模型。为描述大规模商品图像数据,本文选取视觉词包特征作为图像多类预测任务的特征。然而,经典的聚类算法无法解决海量视觉兴趣点条件下视觉词典的训练问题。为解决该问题,本文提出一种加速的K-means算法。在这种算法中,三角形不等式被用于减少冗余计算。而Hierarchical K-means算法则被用于选取更佳的K-means算法初始中心点。为解决类别数目特别巨大时的类别预测问题,本文提出一种多类预测模型。针对预测模型中基础的两类分类问题,本文研究选用χ2-RBF核的SVM分类器。而为完成最终的多类预测任务,本文设计并提出一种基于双败思想的层次预测方法。基于上述模型和算法,本文提出的商品图像类别预测方法具有优秀的时间性能,在大规模商品图像数据应用中具备可行性。另一方面,在商品图像数据集上的实验,成功验证本文所提出图像类别预测方法的有效性。
【关键词】:商品图像 类别预测 海量数据
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.41
【目录】:
- 摘要5-6
- Abstract6-8
- 第一章 引言8-15
- 1.1 本文研究背景与意义8-9
- 1.2 国内外研究现状9-13
- 1.2.1 面向社会化标注图像的单类别预测9-10
- 1.2.2 面向类别预测的图像特征体系10-12
- 1.2.3 大规模数据条件下图像类别预测12-13
- 1.3 本文研究工作概述13
- 1.4 本文的组织结构13-15
- 第二章 面向社会化标注图像的单类别预测15-32
- 2.1 图像视觉特征提取与相似性定义15-20
- 2.1.1 基于网格的颜色直方图特征15-18
- 2.1.2 全局Gabor纹理特征18-19
- 2.1.3 SURF特征19-20
- 2.2 图像文本特征的提取和相似性定义20-22
- 2.2.1 语义概念相似性21-22
- 2.2.2 共现相似性22
- 2.3 单类别预测方法22-28
- 2.3.1 相似性的融合22-23
- 2.3.2 正负样本划分方法23-26
- 2.3.3 KNN预测算法26-28
- 2.4 实验与分析28-31
- 2.4.1 数据集与评价标准28-29
- 2.4.2 实验结果与分析29-31
- 2.5 本章小结31-32
- 第三章 面向多类预测任务的视觉特征体系32-50
- 3.1 BOVW模型32-33
- 3.1.1 文本信息处理中的BOW模型32-33
- 3.1.2 BOVW模型应用于图像33
- 3.2 BOVW特征的提取33-37
- 3.2.1 BOVW特征提取流程33-35
- 3.2.2 聚类训练算法的选择35-37
- 3.3 加速Hierarchical K-means算法37-42
- 3.3.1 加速K-means算法37-40
- 3.3.2 K-means算法初始点选择40-42
- 3.4 算法实现优化42-43
- 3.5 对比实验43-49
- 3.5.1 加速K-means算法对比实验43-46
- 3.5.2 Hierarchical K-means算法对比实验46-49
- 3.6 本章小结49-50
- 第四章 面向网购平台的商品图像类别预测50-63
- 4.1 SVM分类器与核函数的选择50-51
- 4.2 多类预测模型51-57
- 4.2.1 非层次结构的多类预测模型52
- 4.2.2 自顶向下的层次类别预测模型52-55
- 4.2.3 基于双败思想的自底向上层次类别预测模型55-57
- 4.3 实验与分析57-62
- 4.3.1 数据集的定义与类别预测指标57-59
- 4.3.2 实验结果与分析59-62
- 4.4 本章小结62-63
- 第五章 总结和展望63-65
- 5.1 总结63
- 5.2 未来的方向63-65
- 参考文献65-69
- 攻读学位期间参加的科研项目与发表的论文69-70
- 致谢70-71
【相似文献】
中国期刊全文数据库 前10条
1 孤山一叶;;网购,支付前请你细思量[J];电子商务世界;2006年07期
2 ;网购有三好:省劲省鞋不被风吹跑[J];电脑爱好者;2008年06期
3 戴丽珍;;我的快乐网购之旅[J];软件工程师;2008年06期
4 TKD;;网购卖场统统不灵 春节购物何其难![J];电脑爱好者;2009年02期
5 刘欣;;网购用语分析[J];商业文化(学术版);2009年12期
6 缺少浪漫;;网购 我用手机来买单[J];电脑迷;2010年02期
7 薛涌;;美国网购为何不要签收?[J];商界(评论);2010年03期
8 于忠成;;可请人代劳的网购“秒杀”[J];互联网天地;2010年11期
9 本刊实习记者;;直面网购安全威胁[J];信息安全与通信保密;2011年02期
10 王情香;谢子光;;特殊情况下服装网购行为分析[J];电子商务;2011年10期
中国重要会议论文全文数据库 前6条
1 徐婧;;关于我国跨境网购寄递服务的几点思考[A];2012中国快递论坛论文集[C];2012年
2 ;辽宁省快递服务与电子商务网购协同发展研究[A];2012中国快递论坛论文集[C];2012年
3 洪晓梅;杨丽娟;李凤云;;网购时代我国商事信用的困境与出路[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
4 朱文艳;;试析识别网购服装的面料品质[A];“润力杯”全国织造科技创新学术研讨会暨2013织造年会论文集[C];2013年
5 郑洁;程艳;;网络购物中的伦理问题:原因及对策[A];2013年全国哲学伦理学博士后论坛论文集[C];2013年
6 林玲;;传统百货零售业正在遭遇寒冬[A];经济生活——2012商会经济研讨会论文集(下)[C];2012年
中国重要报纸全文数据库 前10条
1 记者 刘刚;最大中文网购商场进军浙江[N];浙江日报;2006年
2 艾福梅;西北城市流行网购年货[N];市场报;2008年
3 徐慧;网购市场暴露信用风险[N];北京商报;2008年
4 杨苏红;今天,你网购了吗?[N];上海金融报;2008年
5 尹代文;“我经常网购”[N];上海金融报;2008年
6 丁海霞;陷阱多多维权难 网购环境待净化[N];闽西日报;2008年
7 本报记者 胡冰心;网购热,热中仍需冷思考[N];镇江日报;2008年
8 潘清;长沙:网购正悄然升温[N];市场报;2008年
9 镜明邋娃娃;网购交易突飞猛进 福建排名全国第六[N];厦门日报;2008年
10 记者 刘娟;网购渐成新兴消费方式[N];大庆日报;2008年
中国博士学位论文全文数据库 前5条
1 赵小军;增强现实网购中的技术接受心理模型[D];陕西师范大学;2015年
2 杨勇攀;网购消费者忠诚影响前因研究[D];西南财经大学;2013年
3 王日爽;基于Bass模型的网购行为扩散预测模型研究[D];大连理工大学;2012年
4 王丽荣;心理距离对网购决策的影响研究[D];中国农业大学;2014年
5 冯炜;消费者网络购物信任影响因素的实证研究[D];浙江大学;2010年
本文关键词:面向网购平台的商品图像类别预测方法,由笔耕文化传播整理发布。
,本文编号:296534
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/296534.html