基于粗糙集特征选择的电信客户流失预测研究
发布时间:2017-06-14 23:08
本文关键词:基于粗糙集特征选择的电信客户流失预测研究,由笔耕文化传播整理发布。
【摘要】:客户流失预测问题是客户关系管理中的一个研究方向,,其研究涉及到多学科、多因素,多环节,是一个复杂的系统。在电信客户流失预测研究上,如何构建高性能的模型从而提高预测模型的预测精度一直是研究的热点,但是影响模型精度的因素非常多,特别是在数据预处理阶段,数据预处理的好坏也会直接影响到模型构建之后的分类性能。而在现有的电信客户流失预测研究方面关于预测模型建立前数据预处理方法的研究还比较缺乏,很多还是基于经验的人工选择法;同时虽然预测模型构建方法的不断改进能提高分类性能,但模型的可解释性还是比较差的,也就是在辅助决策方面并不能发挥太大的效益。在此背景下,探索和研究数据的预处理方法以及决策规则的获取是电信客户流失预测研究的一个新的方面,将具有重要的理论意义和实践价值。粗糙集作为一种处理不确定、不精确问题的数学工具,其属性约简即特征选择和决策规则的获取能力可以用于从数据中挖掘出众多有效信息,因此在知识挖掘领域发挥着越来越强的作用。本文主要研究基于粗糙集扩展模型的特征选择方法和决策规则的获取。 首先采用模糊粗糙集的理论,针对混合型数据,改进属性重要性的计算,设计改进的CEBARKNC特征选择算法,以实验数据进行特征选择,对比分析胡清华提出的模糊粗糙集特征选择算法结果。 其次研究多粒度粗糙集扩展模型,将多粒度粗糙集扩展到模糊环境中,构建一种β多粒度模糊粗糙集模型,设计基于此模型的粒度约简算法,以实验数据对比分析单粒度特征选择算法结果。并提出基于β多粒度模糊粗糙集的决策规则的获取方法,以实例展示决策规则的形式。 然后以电信企业数据作实证,分别以所设计模糊粗糙集特征算法和β多粒度特征选择算法选择属性后,得出的数据以分类器作预测模型进行流失预测对比分析。同时进行决策规则的获取,从而提高模型的可解释性。
【关键词】:客户关系管理 客户流失预测 粗糙集 模糊粗糙集 多粒度粗糙集
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:F274;F626;TP18
【目录】:
- 摘要6-7
- Abstract7-13
- 第1章 绪论13-23
- 1.1 研究背景和意义13-15
- 1.2 国内外研究现状15-20
- 1.2.1 电信客户流失预测研究现状15-18
- 1.2.2 粗糙集研究现状18-20
- 1.3 本文组织结构20-22
- 1.4 主要研究内容22-23
- 第2章 粗糙集相关概念23-31
- 2.1 粗糙集基本理论23-24
- 2.1.1 粗糙集近似集23-24
- 2.2 知识表示24-25
- 2.3 特征选择25
- 2.4 决策系统25-26
- 2.5 模糊粗糙集26
- 2.6 多粒度粗糙集26-27
- 2.7 基于粗糙集的特征选择算法27-30
- 2.7.1 基于信息熵的特征选择算法27-28
- 2.7.2 正域约简特征选择算法28-30
- 2.7.3 基于差别矩阵的特征选择算法30
- 2.8 本章小结30-31
- 第3章 基于模糊粗糙集的特征选择算法31-39
- 3.1 模糊相似关系31-33
- 3.2 模糊等价关系33-35
- 3.3 基于模糊粗糙集的条件信息熵35
- 3.4 基于模糊信息熵的特征选择算法改进35-36
- 3.5 算例36-38
- 3.6 本章小结38-39
- 第4章 β多粒度模糊粗糙集特征选择算法39-49
- 4.1 β多粒度粗糙集39-40
- 4.2 多粒度模糊粗糙集40-41
- 4.3 β多粒度模糊粗糙集41-43
- 4.4 β多粒度模糊粗糙集粒度选择43-45
- 4.4.1 基于正域的粒度重要度计算44-45
- 4.4.2 β多粒度模糊粗糙集粒度选择算法45
- 4.5 算例45-48
- 4.6 本章小结48-49
- 第5章 基于β多粒度模糊粗糙集的决策规则获取49-57
- 5.1 决策规则的获取49
- 5.2 决策规则的度量49-50
- 5.3 β多粒度模糊粗糙集决策规则的度量50-55
- 5.4 本章小结55-57
- 第6章 特征选择在电信客户流失预测中的应用57-71
- 6.1 建模技术57-60
- 6.1.1 神经网络57-58
- 6.1.2 支持向量机(SVM)58-59
- 6.1.3 逻辑回归(Logistic)59
- 6.1.4 贝叶斯网络59-60
- 6.2 评价指标60-61
- 6.2.1 AUC(Area under the receiver operating characteristic curve)60
- 6.2.2 提升系数 (Lift)60
- 6.2.3 准确率(Accuracy)60-61
- 6.3 实验 161-64
- 6.3.1 实验数据和特征选择61
- 6.3.2 实验结果及分析61-64
- 6.4 实验 264-68
- 6.4.1 实验数据和特征选择64-65
- 6.4.2 实验结果及分析65-68
- 6.5 本章小结68-71
- 第7章 总结与展望71-73
- 参考文献73-79
- 攻读硕士学位期间撰写的论文79-81
- 致谢81-82
- 详细摘要82-86
【参考文献】
中国期刊全文数据库 前10条
1 罗彬;邵培基;罗尽尧;刘独玉;夏国恩;;基于粗糙集理论-神经网络-蜂群算法集成的客户流失研究[J];管理学报;2011年02期
2 钱苏丽;何建敏;王纯麟;;基于改进支持向量机的电信客户流失预测模型[J];管理科学;2007年01期
3 王国胤;Rough集理论在不完备信息系统中的扩充[J];计算机研究与发展;2002年10期
4 王国胤,于洪,杨大春;基于条件信息熵的决策表约简[J];计算机学报;2002年07期
5 杨明;;一种基于改进差别矩阵的核增量式更新算法[J];计算机学报;2006年03期
6 庄恒扬,沈新平,陆建飞,黄丽芬;模糊聚类计算方法的理论分析[J];江苏农学院学报;1998年03期
7 李兴国;谢伟;卢光松;;SVM多类别分类方法在客户流失预测中的应用研究[J];计算机应用与软件;2010年03期
8 徐远纯,盛昭瀚,柳炳祥;一种基于决策树的客户流失危机分析方法[J];计算机与现代化;2004年08期
9 许金权;;模糊粗糙集的表示及应用[J];模糊系统与数学;2011年01期
10 张明;唐振民;徐维艳;杨习贝;;可变多粒度粗糙集模型[J];模式识别与人工智能;2012年04期
本文关键词:基于粗糙集特征选择的电信客户流失预测研究,由笔耕文化传播整理发布。
本文编号:450782
本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/450782.html