某上市公司的客户资源分析与预测
发布时间:2017-08-16 10:20
本文关键词:某上市公司的客户资源分析与预测
更多相关文章: Logistic模型 客户流失 RFM模型 客户维护
【摘要】:随着国际化的进程,全球品牌的服装产业竞争日益激烈,交易的主动权逐渐由企业向客户转移,只有以客户为中心的企业才能在竞争中获取优势。客户关系管理理论让我们知道企业80%的利润由20%的客户产生,且开发一个新客户成本要比维持一个老客户的成本要高5倍,所以在营销资源有限的情况下,必须对客户进行细分,以保证将有限的营销资源分配给最有价值的客户,以达到客户保持,增加营收的目的。而本文的研究重点就是从暂时性流失的老客户中找出最可能回归的客户,并将他们交给公司进行精准营销,提高客户保留率,进而扩大营收。本文研究的数据集如下:A公司数据库中有所有客户的历史购买数据、邮件营销数据以及网页点击数据。将截止2015年1月1日与2014年1月1日的暂时性流失客户数据集分别记为样本内数据集与样本外数据集,用bootstrap方法分别抽取200000条数据,按样本内抽取数据照7/3的比例分为建模数据集与样本内验证数据集,响应率分别为1.6%与1.7%,样本外数据集抽取的记为样本外验证集。本文先通过RFM模型的理念,对历史数据进行重新架构,得到2800多个变量。通过变量意义检测,异常值处理,缺失值处理以及转化与比较,得到清洗好的数据集。并通过显著性检验、相关性检验、主成分分析、方差膨胀因子等统计方法并结合变量实际意义进行变量筛选,最终为挑选出最优的7个变量进入模型。模型在建模数据集内的预测正确率高达73%,符合预期,并对7个变量以及模型结果分别进行十分位数检验与Lift Chart检验,发现变量的可解释性都很高,模型对客户的分类排序的效果很好。再将模型代到样本内验证集与样本外验证集中检验模型的稳健性,发现模型在三个数据集上的预测效果很相近,说明模型的稳健性很好。三组数据集中的结果都表示:最可能回归的客户是第一类,再回归可能较大的是第二类到第四类,第五类到第十类回归可能最差。说明该模型不但准确而且稳定性很好,有显著的商业意义,可帮助企业精确识别客户,获取更多利益。
【关键词】:Logistic模型 客户流失 RFM模型 客户维护
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F274
【目录】:
- 摘要5-6
- Abstract6-9
- 第一章 绪论9-14
- 1.1 研究背景与状况9-12
- 1.1.1 RMF模型9-10
- 1.1.2 客户流失与挽回10-12
- 1.2 本文研究的问题12
- 1.3 研究意义与方法12-13
- 1.4 本文组织结构13-14
- 第二章 数据预处理14-23
- 2.1 创造变量14-15
- 2.2 数据集与抽样15
- 2.3 数据的重抽样15-17
- 2.3.1 数据的处理与转化15-17
- 2.4 筛选变量使用的统计方法简介17-21
- 2.4.1 P值17
- 2.4.2 模型卡方统计17
- 2.4.3 相关性分析17-18
- 2.4.4 主成分分析18-19
- 2.4.5 聚类分析19
- 2.4.6 逐步回归19-20
- 2.4.7 熵值20
- 2.4.8 AIC和SC20
- 2.4.9 方差膨胀因子20-21
- 2.5 筛选自变量原则21
- 2.6 变量趋势图21-23
- 第三章 客户再回归模型分析23-35
- 3.1 Logistic模型理论分析23-24
- 3.1.1 Logistic模型的发展与优势23-24
- 3.2 基于Logistic回归的客户再回归模型24-26
- 3.2.1 Logistic模型公式推导24-26
- 3.2.2 Logistic模型的参数估计26
- 3.2.3 Logistic模型应用需注意的问题26
- 3.3 模型结果26-28
- 3.4 模型验证28-35
- 第四章 结论与展望35-37
- 4.1 总结与建议35
- 4.2 不足与展望35-37
- 参考文献37-39
- 致谢39-40
- 附录40-41
【参考文献】
中国期刊全文数据库 前1条
1 肖水清;;基于CRM探讨电信业的客户流失问题[J];现代计算机;2006年01期
,本文编号:682737
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/682737.html