数据挖掘在电子商务销售数据中的分析和应用
发布时间:2017-07-04 16:13
本文关键词:数据挖掘在电子商务销售数据中的分析和应用
更多相关文章: 电子商务 销售数据 数据挖掘 统计分析 动态特性 多关系挖掘 相似度
【摘要】:随着我国居民生活节奏的加快,网络购物以其在时间、地域以及商品选择等多方面的优势而受到网民的青睐。中国网络购物市场规模的扩大和网购者数量的激增促使电子商务平台产生了丰富多样的电子商务销售数据。面对纷繁复杂的销售数据,商家需要深入分析和理解数据并从中挖掘出用户的偏好,兴趣,购买习惯等知识,从而据此制定各种销售策略以满足用户的需求,为电子商品平台赢得更多的顾客是最终的目的。为此,本文将从电子商务销售数据着手将数据挖掘技术应用于电子商务领域,利用统计分析和多关系聚类等多种技术从多个角度对数据进行分析和处理。通过对数据的处理和分析来对用户的购买行为影响因素,,购买习惯和用户群体购买特点等有一个全新的认识和理解。从而使服务商可以利用这些知识对电子商务平台进行创新,获得顾客的满意,赢得顾客资源,获取更大利润。针对电子商务销售数据的特点,本文主要进行了如下几方面的工作: 1)为了对电子商务平台新商品购买者的行为影响因素进行分析,本文引入了统计方法中的线性回归模型对影响新商品购买者购买不同档次新商品的诸多因素进行了研究。通过特征抽取和实证模型的建立得到了一些实用的统计结果。从而对新商品购买者的购买行为有了一定的理解,对于购买不同档次新商品的购买者可以依据各个影响因素的不同程度来制定不同的销售策略。 2)针对电子商务销售数据动态特性问题,本文基于复杂网络对商品销量数据进行动态特性的分析。利用可视化算法将商品销量数据映射到复杂网络,通过对网络统计特性的分析来理解商品销量的波动变化。利用商品销量的动态波动特性可以对商品的销售情况和顾客的购买情况进行深入的分析,从而间接地理解用户对不同类型商品的购买习惯。实验中本文对电子商务平台和门店超市的日用品销量情况进行了对比分析,对不同渠道下的购买者的购买行为进行了对比分析。 3)为了充分利用电子商务销售数据中的多关系信息和用户行为信息,为了解决电子商务领域数据间多关系聚类问题,本文提出了一种有效的融合属性相似和结构相似的相似度度量方法。多种实验验证了本章方法相比于其他方法的优越性。首先将新的相似度度量方法应用于顾客划分问题,通过对实验结果进行定性和定量分析后从群体层面对顾客的行为有了更深的理解;其次,商品推荐实验也更进一步验证了多关系数据中新相似度的计算问题。 通过对上述问题的研究,本文可以作为一套对电子商务销售数据进行全面分析和处理的系统化的解决方案。本文的工作可以较好地应用于电子商务领域,能够为电子商务中的个性化推荐技术和销售策略的制定等提供强有力的技术支持和理论基础,同时本文的研究方法还可以为其他相关适用领域的应用问题提供研究思路。
【关键词】:电子商务 销售数据 数据挖掘 统计分析 动态特性 多关系挖掘 相似度
【学位授予单位】:青岛理工大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:F724.6;TP311.13
【目录】:
- 摘要7-9
- Abstract9-11
- 第一章 绪论11-23
- 1.1 电子商务销售数据及其研究问题11-14
- 1.1.1 电子商务销售数据的产生及其特点11-12
- 1.1.2 基于电子商务销售数据研究的问题12-14
- 1.2 数据挖掘综述14-18
- 1.2.1 数据挖掘技术简介14-17
- 1.2.2 数据挖掘技术应用于电子商务领域存在的问题17-18
- 1.3 数据挖掘在电子商务销售数据中的分析和应用18-21
- 1.3.1 电子商务销售数据研究方法概述18-19
- 1.3.2 基于统计分析的电子商务销售数据研究19-20
- 1.3.3 基于多关系聚类分析的电子商务销售数据研究20-21
- 1.4 本文工作主要内容21-23
- 第二章 基于线性回归模型的新商品购买者行为影响因素分析23-35
- 2.1 引言23-24
- 2.2 假设24-25
- 2.3 方法25-28
- 2.3.1 数据获取情况25-26
- 2.3.2 影响因素分析和特征描述26
- 2.3.3 实证模型26-27
- 2.3.4 解释变量和依赖变量的统计描述27-28
- 2.4 统计结果28-34
- 2.5 本章小结34-35
- 第三章 基于复杂网络的日用商品销售数据分析35-52
- 3.1 引言35-36
- 3.2 可视化算法及幂率分布36-38
- 3.2.1 可视化图36-37
- 3.2.2 幂率分布及其验证策略37-38
- 3.3 数据集描述38-40
- 3.3.1 网店商品日销售数据38-39
- 3.3.2 门店超市商品日销售数据39-40
- 3.4 销量分布及其自相似性分析40-44
- 3.4.1 销量分布40-43
- 3.4.2 自相似性-Hurst 指数43-44
- 3.5 可视化图的统计特性44-50
- 3.5.1 度分布45-49
- 3.5.2 其他统计量结果49-50
- 3.6 结论50-52
- 第四章 基于结构相似度和属性相似度的顾客划分问题52-77
- 4.1 引言52-55
- 4.2 相关工作55-59
- 4.2.1 关系数据挖掘55-56
- 4.2.2 结构相似度计算方法 SimRank56-58
- 4.2.3 属性特征距离度量58-59
- 4.3 方法59-63
- 4.3.1 预备知识59-61
- 4.3.2 Attribute-SimRank 公式61
- 4.3.3 Attribute-SimRank 相似度的计算61-63
- 4.4 聚类实验63-72
- 4.4.1 数据集63-65
- 4.4.2 聚类结果评价指标65-66
- 4.4.3 实验结果分析66-72
- 4.5. 商品推荐实验72-76
- 4.5.1. 协同过滤问题73
- 4.5.2. Top-N 推荐的基本思想73
- 4.5.3. Top-N 推荐实验的具体方法和步骤73-74
- 4.5.4. Top-N 推荐实验结果及其分析74-76
- 4.6 本章小结76-77
- 第五章 总结与展望77-79
- 参考文献79-83
- 攻读硕士学位期间发表的学术论文及科研工作83-84
- 致谢84
【参考文献】
中国期刊全文数据库 前3条
1 陈学军;消费者心理特征对新产品购买的影响作用研究[J];商业研究;2003年04期
2 徐光美;杨炳儒;张伟;宁淑荣;;多关系数据挖掘方法研究[J];计算机应用研究;2006年09期
3 高滢;刘大有;齐红;刘赫;;一种半监督K均值多关系数据聚类算法[J];软件学报;2008年11期
本文编号:518438
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/518438.html