当前位置:主页 > 管理论文 > 领导决策论文 >

基于数据挖掘的电信客户流失预警研究

发布时间:2021-02-21 15:09
  计算机、通信技术的飞速发展,加速了互联网和通讯网的融合,由此带来的是在线社交网络日益成为人们沟通交流、交友等的重要平台,人们对于通信服务的需求也迅速攀升,这给电信行业带来了一系列的机遇。同时又由于市场的饱和、行业服务趋于同质化等因素的影响加剧了电信企业之间的竞争,客户更是成为了稀缺资源,增加新客户变得愈加困难,所以如何稳定住现有的客户不流仍然是各大电信企业关注的焦点问题。而且增加新的客户所花费的成本高于保留老客户的成本,老客户的流失会给企业带来许多损失,所以研究预测客户的流失模型是有必要且有意义的。国内外的专家学者也已经对此进行了大量的研究并取得了许多有价值、可供参考的成果。同时,数据挖掘技术的发展为企业探究预测客户流失模型提供了大量的理论方法支持。本文先对数据挖掘这一领域做了概述,了解了相关的概念、流程和应用功能。鉴于电信客户流失问题本质上是一个二分类问题,所以将应用数据挖掘中的分类方法来解决,在众多分类方法中,选择了运用机器学习方法来解决。因此,在第三章对第四章进行实证分析时所用到的机器学习理论逐一做了介绍,包括先研究了建模前进行数据准备的数据预处理方法,接下来着重探讨和总结归纳了... 

【文章来源】:云南财经大学云南省

【文章页数】:73 页

【学位级别】:硕士

【部分图文】:

基于数据挖掘的电信客户流失预警研究


CRISP-DM标准流程

ROC曲线,ROC曲线,示例,交叉验证


第3章相关理论技术40曲线以真正例率(即召回率)作为图像的纵坐标,假正例率作为图像的横坐标,例如图3.1所示。假正例率是假正例占所有反类样本的比例,表达式为:TNFPFPFPR图3.1示例ROC曲线AUC值即为ROC曲线包含的图中右下部分的面积的值。建议在不平衡数据集上评估模型时选择AUC值作为评价指标53。在第四章的实证分析中,我们将选择AUC来作为模型的评价指标。3.9.3交叉验证交叉验证是用来评估泛化性能的统计学方法。在将数据集划分为训练集和测试集时,相比于只进行一次划分的方法,交叉验证更全面、稳定。因为交叉验证会对数据进行多次划分,训练多个模型。在众多交叉验证方法中k折交叉验证是最常用的。k一般取5或10。k这交叉验证就是将数据集划分为大致相等的k等分,每部分称为折,每次取其中1部分为测试集,剩下k-1部分为训练集,训练一个模型;然后再取不重复的另一部分为测试集,剩余部分为训练集,训练一个模型,如此类推,直至训练了k个模型。k个模型有k个得分,可以取其均值作为训练集上模型得分。交叉验证因为要训练多个模型因而加大了计算成本,减慢了运算速度。

示意图,特征变量,变量,缺失


第4章流失预测模型的选择与建立44图4.1变量Var1~变量Var190数据缺失情况示意图图4.2变量Var191~变量Var230数据缺失情况示意图4.1.2数据预处理数据预处理的目的就是要找出那些对模型准确预测结果有重要影响的特征变量。并非每个特征变量对模型都有相同的影响,因此需要找出哪些特征变量对预测有更大的影响。对此,分两个步骤进行操作:1)删除特征变量:根据特征变量包含不同值的数量删除特征变量,2)提取特征变量:对特征变量进行重要性的排序,选择对预测结果有重要影响的特征变量,因为有些特征变量对模型的预测效果几乎无影响,甚至去掉后,模型的性能会得到提升。关于缺失值,分类型特征变量实例数据用字符串"missing"填充,数值性特征变量的实例数据由其平均值填充。

【参考文献】:
期刊论文
[1]基于Logistic回归的电信宽带客户流失预警分析[J]. 林涛.  中国新通信. 2019(11)
[2]基于随机森林算法的客户流失模型[J]. 朱琦,朱正键,陈伦楷.  电信快报. 2019(04)
[3]决策树算法在客户流失建模中的应用[J]. 朱正键,胡芬芬,梅嘉玲.  移动通信. 2018(11)
[4]数据挖掘研究综述[J]. 周九常,刘智明.  河南图书馆学刊. 2018(08)
[5]基于改进的K近邻和支持向量机客户流失预测[J]. 卢光跃,王航龙,李创创,赵宇翔,李四维.  西安邮电大学学报. 2018(02)
[6]A Heterogeneous Ensemble of Extreme Learning Machines with Correntropy and Negative Correlation[J]. Adnan O.M.Abuassba,Yao Zhang,Xiong Luo,Dezheng Zhang,Wulamu Aziguli.  Tsinghua Science and Technology. 2017(06)
[7]基于决策树的信用卡高端客户流失预测模型研究[J]. 曹淑鹏,闵杰.  北京金融评论. 2017(03)
[8]基于朴素贝叶斯分类算法的学员流失预警应用研究[J]. 陈纪铭.  福建电脑. 2017(08)
[9]电信客户流失预测模型的构建及客户流失因素分析[J]. 李会,吴小兰,李侠.  内蒙古农业大学学报(社会科学版). 2017(03)
[10]基于客户细分和AdaBoost的电子商务客户流失预测研究[J]. 武小军,孟苏芳.  工业工程. 2017(02)

硕士论文
[1]基于PCA-NB算法的客户流失预测[D]. 金鑫.兰州财经大学 2016
[2]朴素贝叶斯算法及其在电信客户流失分析中的应用研究[D]. 孙源泽.湖南大学 2008
[3]基于Pareto/NBD+朴素贝叶斯组合模型的电子商务客户流失预测研究[D]. 刘学伟.四川大学 2006



本文编号:3044526

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3044526.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8fb9e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com