面向电子商务搜索引擎的多属性排序技术研究与实现
本文关键词:面向电子商务搜索引擎的多属性排序技术研究与实现,由笔耕文化传播整理发布。
【摘要】:随着互联网技术的快速发展,电子商务的规模正在急剧的扩大,需要依靠专门的商品搜索引擎来帮助用户检索和筛选商品信息。商品搜索引擎会对查询结果进行排序,而排序结果的质量直接关系到用户的消费体验和效率。目前,常见的商品排序方式为基于单个商品消费属性(比如价格、销售量等)对查询结果进行排序,形式比较单调,不能满足用户逐渐增长的多样化和个性化的消费需求。本文开始探讨基于多个商品属性对查询结果进行排序的可能性。常见的方法为构造聚合函数,将多属性问题转换为单属性问题,然后进行排序。然而由于所有用户使用同一个聚合函数,排序结果不能体现用户对商品不同属性的个性化偏好,导致出现排序结果单一问题;同时也缺乏在客观上对商品本身价值的衡量,导致排序结果具有一定的不合理性;而且随着电子商务中用户与商品数量的急剧增长,在排序的性能方面也面临着很大的挑战。为了应对上述问题,本文以实现对查询结果基于多商品属性的个性化排序为目标展开了研究。首先,本文拟构建基于商品属性的用户偏好模型,通过分析用户在电子商务网站上的购物行为信息,挖掘出用户对商品不同消费属性的偏好,使排序结果能满足用户个性化的消费需求。其次,提出了基于用户偏好的Skyline排序,Skyline排序基于用户偏好模型构建的个性化权重向量,实现对查询结果基于多属性的排序;基于Skyline查询机制增加商品本身在各属性值上的优劣这一客观因素对排序结果的影响,提高了排序的合理性。而且为了求取Skyline查询机制中各类商品的Skycube,本文还提出了一种更加优秀的Skycube计算方法CSBSC.最后,本文将上述方案中需要较高计算能力和存储空间消耗的商品Skycube计算部分放到Hadoop平台上进行,而且实现了CSBSC算法的MapReduce版本CSBSC-MR,并对其在MapReduce框架下的执行过程做了进一步的优化,提高了计算的性能。本文在上述研究工作的基础上构建了一个基于Skyline的商品排序系统SLine系统,以实现对商品查询结果基于多商品属性的个性化排序,SLine系统最终会被部署到东南大学云计算中心。本文最后采用合成基准测试数据集和从京东商城抓取的真实数据分别对CSBSC算法和SLine系统进行了性能验证和测试。
【关键词】:电子商务 商品排序 Skylinet MapReduce
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3;F724.6
【目录】:
- 摘要4-5
- Abstract5-8
- 第一章 绪论8-16
- 1.1 研究背景8-10
- 1.2 国内外研究现状10-13
- 1.3 研究目标13-14
- 1.4 研究内容14-15
- 1.5 论文组织结构15-16
- 第二章 基于Skyline的商品排序系统总体模型及框架16-23
- 2.1 基于Skyline的商品排序系统设计方案16-18
- 2.2 Hadoop平台及MapReduce计算框架介绍18-22
- 2.3 小结22-23
- 第三章 用户偏好模型的分析与建立23-31
- 3.1 基于商品属性的用户偏好模型23-24
- 3.2 模型构建24-27
- 3.2.1 基于AHP的初始赋权24-26
- 3.2.2 基于用户偏好的权重修正26-27
- 3.3 商品属性值的归一化处理27
- 3.4 实验与分析27-30
- 3.4.1 实验环境与数据集27-28
- 3.4.2 用户偏好获取的准确性验证28-29
- 3.4.3 用户消费行为的增加对排序影响29-30
- 3.5 小结30-31
- 第四章 基于用户偏好的Skyline排序机制31-45
- 4.1 Skyline排序31-32
- 4.2 Skycube计算32-33
- 4.3 Skycbue中子空间上的Skyline计算33-37
- 4.3.1 相关子空间上的Skyline计算分析33-35
- 4.3.2 相关子空间上的Skyline计算模型35-36
- 4.3.3 模型优化36-37
- 4.4 基于列排序的Skycube计算方法CSBSC37-40
- 4.4.1 列排序准备38
- 4.4.2 单个属性上的Skyline计算38
- 4.4.3 多个属性上的Skyline计算38-40
- 4.5 CSBSC算法性能验证40-44
- 4.5.1 实验环境与数据集41-42
- 4.5.2 维度可扩展性42
- 4.5.3 基数可扩展性42-43
- 4.5.4 重复数据对算法的影响43-44
- 4.6 小结44-45
- 第五章 MapReduce框架下多Skyline查询算法执行优化45-53
- 5.1 单个属性上Skyline计算的MapReduce实现45-46
- 5.2 多个属性上Skyline计算的MapRedcue实现46-48
- 5.2.1 执行优化46-47
- 5.2.2 MapReduce实现47-48
- 5.3 具有依赖关系的组合式MapReduce48-51
- 5.4 MapReduce框架下CSBSC算法执行性能验证51-52
- 5.4.1 实验环境51
- 5.4.2 执行效率验证51-52
- 5.4.3 集群节点数对执行效率的影响52
- 5.5 小结52-53
- 第六章 基于Skyline的商品排序系统53-69
- 6.1 SLine商品排序系统简介53
- 6.2 SLine系统总体设计53-54
- 6.3 SLine系统具体实现54-61
- 6.4 系统部署环境61-62
- 6.5 SLine系统测试62-68
- 6.5.1 SLine系统功能测试63-66
- 6.5.2 SLine系统总体性能测试66-68
- 6.6 小结68-69
- 第七章 总结与展望69-70
- 参考文献70-72
- 致谢72-73
- 作者在攻读硕士学位期间相关研究工作73-74
- 作者简历74
【相似文献】
中国期刊全文数据库 前10条
1 李志宽;;基于Skyline的企业总图3维信息系统[J];测绘与空间地理信息;2009年02期
2 向剑平;郑皎凌;;Skyline计算在多维排序问题上的分析[J];太原师范学院学报(自然科学版);2009年02期
3 黎刚;徐洁;陈踊;;基于Skyline的太湖流域水环境三维GIS系统设计与实现研究[J];现代商贸工业;2009年23期
4 黄丙湖;韩李涛;陈龙;;基于Skyline视频监控系统研究[J];地理信息世界;2010年03期
5 袁昱纬;;基于Skyline的铁路车站三维信息平台实现研究[J];办公自动化;2010年24期
6 周美娟;俞强;杨诗华;黄丽;;基于Skyline的公安三维GIS展现应用系统[J];测绘科学;2011年03期
7 张露露;陈宜金;;基于Skyline的数字矿山三维综合监测系统的应用研究[J];测绘信息与工程;2011年05期
8 邓瑞鹏;王意洁;李小勇;王媛;;基于数据垂直划分的高效并行Skyline查询[J];计算机工程;2012年14期
9 雷浩川;;基于Skyline的三维场景发布技术分析[J];测绘通报;2012年S1期
10 班鹏新;王元珍;朱虹;张勇;;面向标记安全数据库的Skyline立方体算法[J];华中科技大学学报(自然科学版);2013年02期
中国重要会议论文全文数据库 前10条
1 施朗;;浅谈Skyline平台建立三维网络地理信息系统的优缺点[A];2009全国测绘科技信息交流会暨首届测绘博客征文颁奖论文集[C];2009年
2 葛洪涛;;基于Skyline的三维地理信息系统研究与设计[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
3 陈秉政;;基于Skyline的三维管线系统的实现[A];第十四届华东六省一市测绘学会学术交流会论文集[C];2012年
4 雷浩川;;基于Skyline的三维场景发布技术分析[A];第四届“测绘科学前沿技术论坛”论文精选[C];2012年
5 雷明;张巍;陈利娟;;基于Skyline的水资源三维地理信息系统的设计与实现[A];水与水技术(第3辑)[C];2013年
6 刘剑;张应裕;王东博;周正玉;余建平;;基于Skyline的数字三维国土资源辅助决策系统设计与研发[A];广东省测绘学会第九次会员代表大会暨学术交流会论文集[C];2010年
7 刘莉;蔡军卫;田中彬;马彦;;一种基于移动Agent的分布式Skyline查询算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
8 张光伟;羌鑫林;赵建崇;;SketchUp配合下的Skyline快速三维运用[A];江苏省测绘学会2007年学术年会论文集[C];2008年
9 张光伟;羌鑫林;赵建崇;;SketchUp配合下的Skyline快速三维运用[A];江苏省测绘学会2007'学术年会论文集[C];2008年
10 赵连钧;;基于Skyline的高速公路3D GIS系统开发[A];中国公路学会计算机应用分会2010年学术年会论文集[C];2010年
中国重要报纸全文数据库 前1条
1 慕清;电子地图热点词汇[N];计算机世界;2007年
中国博士学位论文全文数据库 前3条
1 黄伯虎;多环境下Skyline计算问题研究[D];西安电子科技大学;2015年
2 孙圣力;数据流上Skyline查询处理算法研究[D];复旦大学;2008年
3 周红福;基于索引的Skyline算法研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 吴大猛;延迟容忍网络中的Skyline查询研究[D];宁波大学;2014年
2 高天宇;非Skyline的Web服务提升方法研究与实现[D];昆明理工大学;2015年
3 蔡文明;高效关键词Skyline查询算法研宄[D];浙江大学;2015年
4 代博;无线传感数据的Skyline查询算法研究[D];大连海事大学;2015年
5 王雪菲;基于维度偏好的Skyline查询结果精简算法[D];大连理工大学;2015年
6 赵越;不确定数据流的分布并行Skyline查询处理技术研究[D];国防科学技术大学;2013年
7 孙艺斌;基于相似度的传感网Skyline查询处理研究[D];湖南师范大学;2015年
8 刘杨;基于3dsMax及Skyline的城市景观模型构建研究[D];东华理工大学;2015年
9 王倩;大规模环境下基于用户的服务选择方法研究[D];南京邮电大学;2015年
10 张建荣;不确定数据流上的反Skyline查询研究[D];南京航空航天大学;2015年
本文关键词:面向电子商务搜索引擎的多属性排序技术研究与实现,由笔耕文化传播整理发布。
,本文编号:343931
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/343931.html