基于数据挖掘的用户流失预测
发布时间:2021-03-15 12:37
用户流失预测一直是客户关系管理中核心的一环,对保证客户量、增强企业竞争力而言有着重要意义。随着互联网和信息技术的飞速发展,海量用户数据的收集、存储与分析为用户关系管理提供了全新的思路与方法,越来越多运营策略需要使用数据挖掘技术发现用户的行为习惯、识别具有流失倾向的用户。客户流失预测的难点在于用户数据庞杂、噪声多、结构化程度低且类别不平衡,因此,构建合适的预测模型需要从海量数据中提取与用户流失相关的指标并且选择合适的分类算法。本文基于大量真实的用户数据,结合数据可视化方法完成了数据清洗和特征抽提,最终从原始数据中构造了 13个自变量用于流失预测,分别采用欠采样和代价敏感学习解决不平衡问题,构建了三种用户流失预测模型:基于欠采样的Logistic回归模型、基于欠采样的随机森林模型和基于代价敏感的AdaCost模型,三种方法均很好的解决了类别不平衡问题,在训练集和测试集上均获得了较好的分类效果,达到了较高的查全率。结合三种流失预测模型,较长的续费“间隔期”和近期取消交易的行为都预示着用户的高流失倾向;用户的历史交易信息,如交易频率、累计取消比例等对用户是否流失的影响较小,相关结论为付费订阅类...
【文章来源】:南京师范大学江苏省 211工程院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
图2.1用户年龄分布密度图??
图2.2性别与年龄缺失模式图??
图2.3数据集member所有观测各个变量的取值情况??
【参考文献】:
期刊论文
[1]基于社交网络分析和XGBoost算法的互联网客户流失预测研究[J]. 王重仁,韩冬梅. 微型机与应用. 2017(23)
[2]客户流失管理研究现状及展望[J]. 张珠香,骆念蓓. 计算机系统应用. 2017(12)
[3]互联网征信发展与监管[J]. 张健华. 中国金融. 2015(01)
[4]基于改进聚类的电信客户流失预测分析[J]. 姜晓娟,郭一娜. 太原理工大学学报. 2014(04)
[5]客户流失问题研究综述[J]. 于小兵,曹杰,巩在武. 计算机集成制造系统. 2012(10)
[6]随机森林方法及其在客户流失预测中的应用研究[J]. 应维云. 管理评论. 2012(02)
[7]推荐算法综述[J]. 杨博,赵鹏飞. 山西大学学报(自然科学版). 2011(03)
[8]基于SOM的移动通讯客户流失研究[J]. 翟顺平,朱美琳. 现代管理科学. 2008(02)
[9]基于支持向量机的客户流失预测模型[J]. 夏国恩,金炜东. 系统工程理论与实践. 2008(01)
[10]基于神经网络的电信客户流失预测主题建模及实现[J]. 田玲,邱会中,郑莉华. 计算机应用. 2007(09)
本文编号:3084188
【文章来源】:南京师范大学江苏省 211工程院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
图2.1用户年龄分布密度图??
图2.2性别与年龄缺失模式图??
图2.3数据集member所有观测各个变量的取值情况??
【参考文献】:
期刊论文
[1]基于社交网络分析和XGBoost算法的互联网客户流失预测研究[J]. 王重仁,韩冬梅. 微型机与应用. 2017(23)
[2]客户流失管理研究现状及展望[J]. 张珠香,骆念蓓. 计算机系统应用. 2017(12)
[3]互联网征信发展与监管[J]. 张健华. 中国金融. 2015(01)
[4]基于改进聚类的电信客户流失预测分析[J]. 姜晓娟,郭一娜. 太原理工大学学报. 2014(04)
[5]客户流失问题研究综述[J]. 于小兵,曹杰,巩在武. 计算机集成制造系统. 2012(10)
[6]随机森林方法及其在客户流失预测中的应用研究[J]. 应维云. 管理评论. 2012(02)
[7]推荐算法综述[J]. 杨博,赵鹏飞. 山西大学学报(自然科学版). 2011(03)
[8]基于SOM的移动通讯客户流失研究[J]. 翟顺平,朱美琳. 现代管理科学. 2008(02)
[9]基于支持向量机的客户流失预测模型[J]. 夏国恩,金炜东. 系统工程理论与实践. 2008(01)
[10]基于神经网络的电信客户流失预测主题建模及实现[J]. 田玲,邱会中,郑莉华. 计算机应用. 2007(09)
本文编号:3084188
本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/3084188.html