客户流失预测模型研究及其应用
本文选题:客户流失 + 预测 ; 参考:《西北大学》2017年硕士论文
【摘要】:随着全球的商业竞争愈来愈激烈,客户流失预测已经成为客户关系管理中非常重要的内容。预测即将流失的客户,并制定相应的措施挽留客户已经成为促进企业发展的关键性因素。本文从对电信和信用卡客户的行为数据分析入手,针对其中的冗余特征和正负类样本不均衡等特点,提出一种新的特征选择算法和非均衡数据处理算法,以此建立一种新的客户流失预测模型。本文的主要工作内容如下:1.针对客户信息数据量大且特征冗余的问题,提出一种多指标融合的mRMR特征选择算法(MIF-mRMR)。该算法对mRMR算法进行改进,将马氏距离和最大信息系数相结合来综合评定特征和类别、特征和特征之间的相关性。实验结果证明,该算法所选择的特征子集维度较小,且与mRMR算法相比准确率提高3%左右。2.针对客户数据中流失客户与正常客户比例相差较大的问题,提出一种基于边界混合采样的非均衡数据处理算法(BMS)。该方法首先通过引进“变异系数”找出样本的边界域和非边界域,然后对边界域中的少数类样本进行过采样处理,非边界域中的多数类样本进行欠采样处理,从而实现原始样本的均衡化。实验结果证明,该算法与其它3种流行的非均衡数据处理算法相比均能有效地提升少数类样本的识别性能。3.基于以上内容,提出一种新的客户流失预测模型。该模型首先分别使用MIF-mRMR算法和BMS算法对数据进行特征选择和均衡化,然后将均衡化后的数据送入SVM、C4.5和随机森林3种分类器进行流失客户的预测。实验结果表明,使用该模型能够得到较好的客户流失预测结果,同时SVM分类器相较其他两种分类器更适合客户流失预测的研究。
[Abstract]:With the global business competition becoming more and more fierce, customer churn prediction has become a very important part of customer relationship management. It is a key factor to promote the development of enterprises to predict the customers that will soon be lost and to formulate corresponding measures to retain them. Based on the analysis of behavior data of telecom and credit card customers, a new feature selection algorithm and unbalanced data processing algorithm are proposed in this paper. Based on this, a new customer churn prediction model is established. The main work of this paper is as follows: 1. Aiming at the problem of large amount of data and redundant features of customer information, a multi-index fusion mRMR feature selection algorithm (MIF-mRMRA) is proposed. The algorithm improves the mRMR algorithm and combines Markov distance with the maximum information coefficient to evaluate the correlation between features and categories, features and features. Experimental results show that the feature subset dimension chosen by the algorithm is small and the accuracy of the proposed algorithm is about 3% higher than that of mRMR algorithm. In order to solve the problem that the ratio of customer loss and normal customer is different from that of normal customer, a non-equilibrium data processing algorithm based on boundary mixed sampling is proposed. First, the "coefficient of variation" is introduced to find out the boundary and non-boundary regions of the samples, then a few kinds of samples in the boundary domain are oversampled, and most of the samples in the non-boundary domain are under-sampled. In order to realize the equalization of the original samples. Experimental results show that the proposed algorithm can effectively improve the recognition performance of a small number of samples compared with the other three popular unbalanced data processing algorithms. Based on the above, a new customer churn prediction model is proposed. The model firstly uses MIF-mRMR algorithm and BMS algorithm to select and equalize the data, and then the equalized data are sent into SVMC4.5 and random forest classifier to predict the loss of customers. The experimental results show that the model can get better customer churn prediction results, and the SVM classifier is more suitable for customer churn prediction than the other two classifiers.
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F274;TP301.6
【相似文献】
相关期刊论文 前10条
1 V.库马尔;;美国公司如何避免客户流失[J];IT时代周刊;2010年11期
2 李睿仙;庞洁;胡建华;王清心;汪伟;;一种基于电信客户流失预警的解决方案[J];电脑知识与技术(学术交流);2007年02期
3 夏国恩;邵培基;;改进的支持向量分类机在客户流失预测中的应用[J];计算机应用研究;2009年06期
4 夏国恩;;基于简易支持向量机的客户流失预测研究[J];计算机应用研究;2010年03期
5 于小兵;曹杰;巩在武;;客户流失问题研究综述[J];计算机集成制造系统;2012年10期
6 丁旭;电信大客户流失原因分析及对策[J];现代电信科技;2003年01期
7 孔f3;探究电信行业客户流失[J];信息网络;2004年01期
8 牛琨;张舒博;;基于数据挖掘技术的电信业客户流失管理框架[J];电信工程技术与标准化;2006年01期
9 ;贴身咨询助营销精准实施——北京移动成功化解拍照客户流失危机[J];每周电脑报;2007年25期
10 蒋盛益;王连喜;;面向电信的客户流失预测模型研究[J];山东大学学报(理学版);2011年05期
相关会议论文 前10条
1 司学峰;蒋国瑞;李英毅;;基于数据挖掘技术的客户流失预测研究综述[A];第三届中国智能计算大会论文集[C];2009年
2 李红霞;;电信客户流失与客户保持分析[A];中国企业运筹学[C];2009年
3 张俊巍;;电信行业客户流失管理模型浅析[A];黑龙江省通信学会学术年会论文集[C];2005年
4 段巍巍;;电信客户流失预测主题建模[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
5 张海波;赵焕成;;电信移动客户流失的预测模型——基于社会网络分析的实证研究[A];21世纪数量经济学(第11卷)[C];2010年
6 苏小龙;;基于消费行为认知的固网大客户流失研究[A];中国创新与企业成长(CI&G)2013年度会议论文集[C];2013年
7 余力涛;党延忠;杨光飞;;基于迁移学习的客户流失预测模型[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
8 李保升;陆炜颖;吕廷杰;;移动客户流失预测模型研究[A];2006中国控制与决策学术年会论文集[C];2006年
9 柳炳祥;盛昭翰;;一种基于Rough集的客户流失风险分析方法[A];2002年中国管理科学学术会议论文集[C];2002年
10 李萍;齐佳音;舒华英;;归因理论在移动客户流失管理中的应用探讨[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
相关重要报纸文章 前10条
1 冰蓝;如何防止客户流失[N];电脑商报;2005年
2 ;揭开客户流失真相[N];计算机世界;2005年
3 吴U,
本文编号:1864433
本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/1864433.html