当前位置:主页 > 管理论文 > 信息管理论文 >

基于数据挖掘技术的移动客户流失预测研究

发布时间:2017-10-07 04:28

  本文关键词:基于数据挖掘技术的移动客户流失预测研究


  更多相关文章: 数据挖掘 客户流失 Logistic回归 决策树 客户流失管理


【摘要】:在大数据时代,谁能够吸取隐藏在这些大数据后面的有用知识,并把这些隐性知识利用起来,谁就有机会率先发现商机。数据挖掘,就是这样一门技术,它能够从海量数据中提取人们感兴趣的知识。近十几年来,出现了许多数据挖掘的新方法,如神经网络、文本挖掘、支持向量机等,特别是最近几年,数据挖掘基本概念和方法都已成型,并逐渐得到人们的认可。数据挖掘研究正在向更深层次的方向发展! 随着电信改革的不断深入,近几年通信行业在我国蓬勃发展,其产业结构链变得越来越复杂,很多环节都影响了客户行为,从而也赋予了客户流失新的内涵,使得客户挽留与客户保有难度加大。于是,国内很多电信运营商开始寻找新的方法,预测电信客户的流失问题。基于数据挖掘技术的电信客户流失预测研究便开始在国内发展起来! 本文根据客户价值与客户生命周期理论,借助H市移动公司的业务数据,采用了Logistic回归和决策树的数据挖掘算法,遵循CRISP-DM标准数据建模准则,逐步按照商业理解、数据理解、数据准备、模型构建、模型评估与模型部署的步骤,对移动客户流失问题做了预测研究,并为移动客户的流失管理提供了战略性策略。 全文共分为六个章节。 第一章绪论。对本文的研究背景、研究现状、主要研究内容、研究方法和创新点进行了描述。 第二章数据挖掘概述。对数据挖掘的内涵、数据挖掘工具、挖掘算法和建模方法论进行了总结,尤其是详细介绍了决策树和Logistic回归挖掘算法;在梳理CRISP-DM数据挖掘方法论的基础上,详细讲解了使用Logistic回归建模的全过程。 第三章移动客户流失相关理论分析。首先对移动客户流失的概念进行了界定,确定了本文研究的对象;然后介绍了与客户流失相关的理论,即客户价值理论和客户关系生命周期理论;最后定性的提出了影响移动客户流失的原因,并分类做了阐述。 第四章移动客户流失实证分析。采用H市移动公司的业务数据,使用Logistic回归和决策树建立了移动客户流失预测模型,按照业务理解、数据准备、数据探索、变量选择、模型构建与选择、模型评估和模型结果分析的数据挖掘流程,对移动客户流失问题做了预测研究。其中在变量选择时,提出了使用WOE值和Ⅳ值筛选变量的新方法,通过建立的3个模型效果对比分析,可以看出用WOE值能够对Logistic回归模型的输入变量进行离散化处理,并且也可以用Ⅳ值来筛选预测变量。另外,3个模型对比分析,通过查看它们的提升图,可以得出两个结论:第一,使用WOE值离散化变量,能够提升Logistic回归模型效果;第二,使用Logistic回归比使用决策树构建移动客户流失预测模型的效果更好。 第五章移动客户流失管理策略。根据第三章的客户价值理论和客户生命周期理论,结合第四章实证分析得到的客户流失预测模型结果,创新性地将潜在流失客户分成三类,即考察期低价值客户、稳定期低价值客户和退化期高价值客户,并分别制定了客户挽留策略和营销策略。 第六章对全文进行总结,并为以后的研究提供了建议。 本文的创新之处主要有以下两点: 第一,由本研究的客户流失文献综述可知,大部分的学者在做客户流失预测分析时,只是利用了一种数据挖掘算法或者没有实证分析,缺乏使用多种数据挖掘算法建模之间的对比分析。本文使用了Logistic回归和决策树两种数据挖掘算法对比研究移动客户流失问题。通过模型的对比分析,更能说明模型的提升效果。 第二,在很多使用数据挖掘技术预测客户流失的研究中,数据挖掘建模中的变量选择过程讲解不详细透彻。本文在研究时,采用了基于区分度、变量的WOE值和Ⅳ值、相关性的方法来共同筛选自变量,使得选择输入变量有据可依。
【关键词】:数据挖掘 客户流失 Logistic回归 决策树 客户流失管理
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:F274;F626
【目录】:
  • 摘要4-6
  • ABSTRACT6-9
  • 目录9-12
  • 1. 绪论12-19
  • 1.1 研究背景12-13
  • 1.2 客户流失文献综述13-16
  • 1.2.1 客户流失国外研究13-14
  • 1.2.2 客户流失国内研究14-16
  • 1.3 主要研究内容16-17
  • 1.4 本研究的创新点17
  • 1.5 研究思路17-19
  • 2. 数据挖掘概述19-37
  • 2.1 数据挖掘的内涵19-20
  • 2.2 数据挖掘工具20-22
  • 2.2.1 IBM Intelligent Miner20-21
  • 2.2.2 SPSS Clementine21
  • 2.2.3 SAS Enterprise Miner21-22
  • 2.2.4 其他挖掘工具22
  • 2.3 数据挖掘算法22-31
  • 2.3.1 关联规则23
  • 2.3.2 聚类分析23-24
  • 2.3.3 决策树24-26
  • 2.3.4 Logistic回归26-31
  • 2.4 数据挖掘建模方法论31-37
  • 2.4.1 CRISP-DM建模标准31-33
  • 2.4.2 Logistic回归建模过程33-37
  • 3. 移动客户流失理论分析37-45
  • 3.1 移动客户流失概念37-39
  • 3.2 客户流失相关理论39-43
  • 3.2.1 客户价值理论39-40
  • 3.2.2 客户关系生命周期理论40-43
  • 3.3 移动客户流失的原因分析43-45
  • 4. 移动客户流失实证分析45-59
  • 4.1 模型的总体思路45
  • 4.2 数据来源45
  • 4.3 业务理解45-47
  • 4.3.1 预测客户群范围45-46
  • 4.3.2 流失客户定义46-47
  • 4.4 数据准备47-50
  • 4.4.1 数据描述47-49
  • 4.4.2 模型时间窗口49
  • 4.4.3 数据探索49-50
  • 4.5 变量选择50-53
  • 4.5.1 基于区分度的筛选50
  • 4.5.2 基于WOE值和IV值的筛选50-53
  • 4.5.3 基于相关性的筛选53
  • 4.6 模型构建与选择53-57
  • 4.6.1 目标客户群的细分53-55
  • 4.6.2 模型构建55-56
  • 4.6.3 模型选择56-57
  • 4.7 模型评估57-58
  • 4.8 模型结果分析58-59
  • 5. 移动客户流失管理策略59-62
  • 5.1 考察期低价值客户59-60
  • 5.2 稳定期低价值客户60
  • 5.3 退化期高价值客户60-62
  • 6. 总结与展望62-65
  • 6.1 研究总结62-63
  • 6.2 研究展望63-65
  • 参考文献65-67
  • 致谢67-68
  • 在读期间科研成果目录68

【参考文献】

中国期刊全文数据库 前5条

1 凤尔银,张陟,郑贤锋;Newton-Raphson方法优化势函数参数[J];安徽师范大学学报(自然科学版);2001年03期

2 邓森文;马溪骏;;基于Cox模型的移动通信行业中低端客户流失预测研究[J];合肥工业大学学报(自然科学版);2010年11期

3 夏国恩;;基于核主成分分析特征提取的客户流失预测[J];计算机应用;2008年01期

4 吴丽娜,周支立,刘斌;移动通讯公司流失客户信息分析[J];情报杂志;2005年05期

5 应维云;蔺楠;谢雅雅;李秀;;用LDA Boosting算法进行客户流失预测[J];数理统计与管理;2010年03期



本文编号:986935

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/sjfx/986935.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8a8a2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com