基于数据挖掘的网购用户流失预测研究
本文关键词:基于数据挖掘的网购用户流失预测研究,,由笔耕文化传播整理发布。
【摘要】:在日新月异的互联网时代,电子商务相对于传统的购物模式的优势愈发明显,方便、快捷的网络购物模式正吸引着越来越多的用户。与此同时,大规模的交易与需求令电商之间的竞争日趋激烈,企业间的竞争一方面促进了电子商务的发展,同时,也加速了电商的优胜劣汰。企业竞争加剧了,客户对企业而言,就成了最重要的资源,如何吸引客户并留住客户就成了企业的工作重点,这也使得客户流失成为众多企业的关注问题。电商们为了确保自己在激烈的竞争市场的良性发展,不仅要令自身产品具备吸引力,还要深入了解用户的偏好和满意度,对用户的行为特征进行深度发掘。电商用户行为的不稳定性较大,流失率较高,那么,能否在客户流失之前及时发现他们,同时帮助营销部门锁定目标流失客户群并制定合适的营销方案是企业市场部门的重要工作。能比较准确地预测用户的流失,对流失风险较大的用户实施有针对性地挽留策略,降低流失率是电子商务企业日常运营管理中的重要工作。在这些方面,数据挖掘可以帮助企业。本文将数据挖掘技术运用到商业分析中,预测天猫用户在特定时间内的流失情况,从而实施挽留策略,降低流失率。本文主要进行了如下三方面的工作:1、介绍了客户流失的研究背景和研究现状,重点介绍了采用数据挖掘方法预测客户流失的三种模型,包括:决策树模型、迭代决策树(Gradient Boosting Decision Tree)模型,简称GBDT、逻辑斯蒂回归模型。2、运用迭代决策树模型处理特征并得到特征集合,建立逻辑斯蒂回归预测模型对样本进行分类预测。3、获取淘宝天猫网站用户2014年四个月的真实数据集,用来预测天猫用户第五个月的购买行为,然后对所提模型的预测能力进行实证分析。本文在实证分析中得到了良好的预测结果,实验最终得到的准确率是86%,召回率是79%。该模型已经具备了较好的预测能力,可以应用到电子商务企业实施日常客户流失预测,帮助电子商务企业加强客户管理,提高客户的保持率。
【关键词】:电子商务 数据挖掘 用户行为 用户流失 逻辑斯蒂回归模型 迭代决策树模型
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F724.6;TP311.13
【目录】:
- 摘要4-6
- Abstract6-11
- 第1章 绪论11-14
- 1.1 研究背景和意义11-12
- 1.2 本文的主要工作12-14
- 1.2.1 研究思路12
- 1.2.2 研究内容12-14
- 第2章 客户流失研究现状分析14-19
- 2.1 客户流失预测方法介绍14-17
- 2.1.1 基于决策树算法的客户流失预测14-15
- 2.1.2 基于逻辑回归的客户流失预测15-16
- 2.1.3 基于贝叶斯网络的流失预测研究16
- 2.1.4 基于支持向量机的客户流失预测模型16-17
- 2.2 本文的研究动机17-19
- 2.2.1 当前研究存在的不足17
- 2.2.2 本文的研究特色与创新17-19
- 第3章 基本理论方法与技术19-30
- 3.1 客户关系管理19-20
- 3.1.1 客户关系管理理论介绍19-20
- 3.2 用于预测的数据挖掘技术20-26
- 3.2.1 决策树模型20-21
- 3.2.2 迭代决策树算法21-23
- 3.2.3 逻辑斯蒂回归算法23-25
- 3.2.4 正则化25-26
- 3.3 离群点检测26-27
- 3.4 特征标准化27
- 3.5 特征的正态变换27-28
- 3.6 特征再处理28-30
- 第4章 电子商务网站用户购买行为预测模型30-38
- 4.1 用户网购行为的基本分析30-32
- 4.1.1 网购用户的含义30-32
- 4.2 网购用户购物流程32
- 4.3 网购用户行为数据的来源32-34
- 4.4 特征选择34-35
- 4.5 用迭代决策树模型来处理连续特征35-37
- 4.6 逻辑斯蒂回归预测模型37-38
- 第5章 天猫用户在线购买行为实证分析预测38-47
- 5.1 数据来源与描述38-39
- 5.2 数据集划分39
- 5.3 数据预处理39-41
- 5.4 特征选择41-44
- 5.4.1 时间维度划分41-42
- 5.4.2 特征维度划分42-44
- 5.5 模型训练和结果评估44-47
- 5.5.1 模型训练44
- 5.5.2 模型评价44-47
- 第6章 全文工作总结与展望47-51
- 参考文献51-54
- 作者简介及在学期间科研成果54-55
- 致谢55
【相似文献】
中国期刊全文数据库 前10条
1 香丽芸;浅谈数据挖掘及其应用[J];昌吉师专学报;2001年02期
2 郑雪燕,张杰明,岳洋;数据挖掘语言[J];计算机时代;2001年11期
3 刘明晶;数据挖掘[J];华南金融电脑;2001年04期
4 张伟;刘勇国;彭军;廖晓峰;吴中福;;数据挖掘发展研究[J];计算机科学;2001年07期
5 钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期
6 朱建平,张润楚;数据挖掘的发展及其特点[J];统计与决策;2002年07期
7 傅岚;在数据海洋中打捞信息数据挖掘[J];科技广场;2002年11期
8 李峻;数据挖掘,企业洞察先机的“慧眼”[J];中国计算机用户;2002年48期
9 罗可,蔡碧野,卜胜贤,谢中科;数据挖掘及其发展研究[J];计算机工程与应用;2002年14期
10 ;2002数据挖掘研讨班[J];计算机工程;2002年06期
中国重要会议论文全文数据库 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
中国博士学位论文全文数据库 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年
6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年
7 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年
8 李玉华;面向服务的数据挖掘关键技术研究[D];华中科技大学;2006年
9 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
10 王珊珊;知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
本文关键词:基于数据挖掘的网购用户流失预测研究,由笔耕文化传播整理发布。
本文编号:395072
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/395072.html