Web数据挖掘在电子商务中的研究与应用
发布时间:2017-05-01 11:03
本文关键词:Web数据挖掘在电子商务中的研究与应用,由笔耕文化传播整理发布。
【摘要】:近年来,随着网络科技以及移动客户端的快速发展,加速了网购用户的热潮,电子商务的发展已经成为影响经济的关键因素,同时用户在网购过程中,产生大量的用户访问数据和交易数据,这些数据看似杂乱但包含巨大的商业价值,电子商务迫切需要对自身的数据信息和相关联数据进行挖掘,从而能取得竞争优势。Web数据挖掘技术也成为了高校和企业的重点研究热点。本文针对实际需求,编写爬虫抓取用户交易数据,并连续抓取淘宝某些商品的销量数据作为研究数据源。首先,介绍了当前Web数据挖掘在电子商务的应用,主要集中在物品个性化推荐,根据其推荐算法不同,有不同类别的个性化推荐系统,各有优缺点。当前电子商务网站最主要的还是在基于用户和物品的关联规则推荐。其次,重点介绍模糊聚类算法在客户群划分上的应用,对客户交易数据进行处理,实现模糊聚类算法对其进行分类,根据每类具有的特性对客户进行聚类分析,从而提供商业指导,对客户的喜好偏爱以及商品价格消费区间,以及对电商站点的贡献度,是否是优质客户源,是否是基础客户源或者需要保持的重点客户源等进行研究分类。从而根据数据源,模糊聚类算法在该功能有着很好的聚类效果,将客户划分更加明细。最后,介绍数据抓取技术、安全策略和爬虫主要的模块,包括存储模块、爬虫模块和部署实时监控模块。同时,对抓取的淘宝网的30天的商品销售数据进行拟合幂律分布,以时间序列对商品销量和营业额进行预测分析,采用可视化算法将时间序列数据映射到复杂网络,研究电商销量时间序列分布特点以及波动特性的区别,关注消费者对商品价格以及销售活动等敏感度相关性。
【关键词】:Web数据挖掘 模糊聚类 电子商务 爬虫 电商销售数据
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;F724.6
【目录】:
- 摘要6-7
- Abstract7-14
- 第1章 绪论14-18
- 1.1 课题研究背景及意义14-15
- 1.2 研究现状及发展趋势15-16
- 1.2.1 数据挖掘的研究现状15
- 1.2.2 Web挖掘在电子商务中的现状15-16
- 1.2.3 Web挖掘在电子商务中发展趋势16
- 1.3 论文研究内容16-17
- 1.4 论文组织结构17-18
- 第2章 数据挖掘与Web数据挖掘18-26
- 2.1 引言18
- 2.2 数据挖掘技术18-21
- 2.2.1 数据挖掘概述18
- 2.2.2 数据挖掘主要技术18-20
- 2.2.3 数据挖掘应用领域20-21
- 2.3 Web数据挖掘21-23
- 2.3.1 Web数据挖掘概念21
- 2.3.2 Web数据特点21-22
- 2.3.3 Web数据挖掘分类22
- 2.3.4 Web挖掘的新研究领域22-23
- 2.4 面向电子商务的Web挖掘23-25
- 2.4.1 面向电子商务的Web数据源23-24
- 2.4.2 面向电子商务的Web挖掘技术24-25
- 2.5 本章小结25-26
- 第3章 电子商务中推荐系统研究26-34
- 3.1 引言26
- 3.2 电子商务概述26-27
- 3.2.1 电子商务的概念26
- 3.2.2 电子商务的类型26-27
- 3.3 电子商务的个性化推荐系统类型27-29
- 3.3.1 基于协同过滤的个性化推荐系统27
- 3.3.2 基于内容的个性化推荐系统27-28
- 3.3.3 基于网络结构的个性化推荐系统28
- 3.3.4 混合个性化推荐系统28
- 3.3.5 基于Web挖掘的推荐系统28-29
- 3.4 个性化推荐算法29-33
- 3.4.1 协同过滤算法29-30
- 3.4.2 聚类分析算法30-31
- 3.4.3 贝叶斯网络31-32
- 3.4.4 关联规则32-33
- 3.5 本章小结33-34
- 第4章 基于模糊聚类的客户群划分34-48
- 4.1 引言34
- 4.2 聚类分析概述34-36
- 4.2.1 聚类分析方法34-35
- 4.2.2 聚类算法存在问题及改进方法35-36
- 4.3 模糊C-均值聚类36-41
- 4.3.1 FCM算法思想36-38
- 4.3.2 变权划分熵38-40
- 4.3.3 模糊加权指数40-41
- 4.4 试验数据分析41-47
- 4.4.1 数据来源41-42
- 4.4.2 FCM核心代码42-44
- 4.4.3 实验结果分析44-47
- 4.5 本章小结47-48
- 第5章 基于网络的电商销售数据分析48-64
- 5.1 引言48
- 5.2 数据抓取技术48-50
- 5.2.1 爬虫原理48
- 5.2.2 数据抓取策略48-49
- 5.2.3 安全策略49-50
- 5.3 数据抓取模块50-56
- 5.3.1 系统的整体架构50-51
- 5.3.2 数据存储模块51-53
- 5.3.3 爬虫模块53-54
- 5.3.4 实时监控54-56
- 5.4 电商销售数据分析56-63
- 5.4.1 可视化和幂律分布56-57
- 5.4.2 自相性分析57-58
- 5.4.3 度分布58
- 5.4.5 数据销量分布试验58-63
- 5.5 本章小结63-64
- 结论与展望64-66
- 参考文献66-69
- 攻读学位期间发表的学术论文69-71
- 致谢71
【参考文献】
中国期刊全文数据库 前7条
1 赵嘉凌;数据挖掘在数字图书馆中的应用研究[J];计算机与网络;2005年10期
2 蔡元萃;陈立潮;;聚类算法研究综述[J];科技情报开发与经济;2007年01期
3 蒋建洪;罗玫;;基于C2C交易的卖方信用增长模式分析[J];计算机工程与科学;2014年04期
4 毕方明,张永平;数据挖掘技术研究[J];计算机工程与设计;2004年12期
5 陈莉,焦李成;Internet/Web数据挖掘研究现状及最新进展[J];西安电子科技大学学报;2001年01期
6 刘建国;周涛;汪秉宏;;个性化推荐系统的研究进展[J];自然科学进展;2009年01期
7 李海林;郭崇慧;;基于多维形态特征表示的时间序列相似性度量[J];系统工程理论与实践;2013年04期
中国硕士学位论文全文数据库 前1条
1 周世东;Web数据挖掘在电子商务中的应用研究[D];北京交通大学;2008年
本文关键词:Web数据挖掘在电子商务中的研究与应用,由笔耕文化传播整理发布。
,本文编号:338764
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/338764.html