基于剪枝随机森林的电信行业客户流失预测
本文关键词:基于剪枝随机森林的电信行业客户流失预测
更多相关文章: 客户流失预测 随机森林 组合分类器 剪枝技术
【摘要】:针对电信行业客户流失预测问题的复杂性,本文将能够处理大规模数据、容噪性能较好的组合分类器算法——随机森林方法应用于电信行业的客户流失预测中.针对影响组合分类器性能的关键指标——差异度,提出了一种新的基于随机森林相似度矩阵的差异度测度,并在此基础上提出了一种改进的组合剪枝技术,对随机森林的基分类器进行剪枝,得到规模较小但泛化性能更优的基于剪枝随机森林的客户流失预测模型.实验结果表明,与其他方法相比,新的差异度测度方法更好地描述单个分类器之间的差异度,本文提出的基于剪枝随机森林的客户流失预测模型具有更高的预测准确率、更小的组合分类器规模和更好的效率,有望成为该领域一种可行且有效的方案.
【作者单位】: 厦门理工学院管理学院;
【关键词】: 客户流失预测 随机森林 组合分类器 剪枝技术
【基金】:国家自然科学基金(71371162) 厦门理工学院高层次人才项目(YSK120162)
【分类号】:F626;TP18
【正文快照】: 随着经济全球化化进程,电信行业的市场格局发生了重大改变,因而竞争也变得空前的激烈.研究表明,流失一个已有客户的代价是发展一个新客户所带来利润的5倍[1].因此,高效准确地预测和预防客户流失成为电信运营商工作的重中之重.电信行业的客户流失预测问题是一个二分类问题,根据
【参考文献】
中国期刊全文数据库 前4条
1 罗彬;邵培基;罗尽尧;刘独玉;夏国恩;;基于粗糙集理论-神经网络-蜂群算法集成的客户流失研究[J];管理学报;2011年02期
2 罗彬;邵培基;夏国恩;;基于多分类器动态选择与成本敏感优化集成的电信客户流失预测研究[J];管理学报;2012年09期
3 肖进;贺昌政;;基于SODM的贝叶斯分类器结构学习及其在客户分类中的应用[J];管理科学;2008年04期
4 应维云;覃正;赵宇;李兵;李秀;;SVM方法及其在客户流失预测中的应用研究[J];系统工程理论与实践;2007年07期
【共引文献】
中国期刊全文数据库 前10条
1 蔡坤琪;;基于相关鉴别分析和随机森林的人脸识别方法[J];安徽电子信息职业技术学院学报;2012年01期
2 李飞;高小榕;高上凯;;基于随机森林算法的高维脑电特征优选[J];北京生物医学工程;2007年04期
3 陈建新;西广成;王伟;赵慧辉;陈静;;数据挖掘分类算法在冠心病临床应用的比较[J];北京生物医学工程;2008年03期
4 熊文;王枞;;改进粒子群与支持向量机混合的特征变换[J];北京邮电大学学报;2009年06期
5 蔡金锭;鄢仁武;;基于小波分析与随机森林算法的电力电子电路故障诊断[J];电力科学与技术学报;2011年02期
6 胥海威;何宽;;改进随机决策树群算法在监督分类中的应用[J];地理与地理信息科学;2010年06期
7 张郴;张捷;;中国入境旅游需求预测的神经网络集成模型研究[J];地理科学;2011年10期
8 桂洁;段继光;杨素科;;客户流失预测数据挖掘方法对比分析[J];电脑学习;2010年04期
9 马昕;郭静;孙啸;;蛋白质中RNA-结合残基预测的随机森林模型[J];东南大学学报(自然科学版);2012年01期
10 胡锋;邢洁清;;一种基于小波变换与随机森林的人脸识别方法[J];电脑知识与技术;2011年16期
中国重要会议论文全文数据库 前10条
1 贾少春;胡秀珍;;A Method of Predicting theβ-hairpin Motifs in Proteins[A];第四届全国生物信息学与系统生物学学术大会论文集[C];2010年
2 李胜朋;王洪礼;冯剑丰;;基于不连续回归树的最大李雅谱诺夫指数计算方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
3 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
4 张红梅;;基于粗糙集特征约简的SVM集成入侵检测模型[A];2009中国控制与决策会议论文集(3)[C];2009年
5 司学峰;蒋国瑞;李英毅;;基于数据挖掘技术的客户流失预测研究综述[A];第三届中国智能计算大会论文集[C];2009年
6 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
7 曹东升;许青松;梁逸曾;;Computer-Aided Prediction of Toxicity with Substructure Pattern and Random Forest[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
8 李梦龙;;Systematically analyze and select key features to microRNA precursors identification based on random forests[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
9 秦文丽;李益洲;李娟;余乐正;郭延芝;李梦龙;;基于蛋白质序列信息的信号肽上有害非同义单核苷酸多态性的预测[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
10 冯飞翔;冯辅周;江鹏程;刘菁;刘建敏;;随机森林和k-近邻法在某型坦克变速箱状态识别中的应用[A];第八届全国转子动力学学术讨论会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
3 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
4 罗彬;基于MMOI方法的电信客户流失预测与挽留研究[D];电子科技大学;2010年
5 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
6 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
7 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年
8 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
9 田健;计算机辅助分子设计提高蛋白质热稳定性的研究[D];中国农业科学院;2011年
10 戴俊程;基于全基因组关联研究的中国女性乳腺癌风险预测模型研究[D];南京医科大学;2011年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
3 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
4 李红;数据挖掘中特征选择与聚类算法研究[D];大连理工大学;2010年
5 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
6 朱新荣;径向基函数神经网络集成算法的研究及应用[D];大连理工大学;2010年
7 严康;基于支持向量机的特征选择算法研究[D];大连理工大学;2010年
8 唐晓敏;基于霍夫变换及条件概率模型的多目标检测[D];大连理工大学;2010年
9 王若飞;基于机器学习的蛋白质折叠预测算法研究[D];湘潭大学;2010年
10 杨向军;Web spam检测系统的设计和实现[D];华南理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 李中才;;改进的实数遗传算法在求解组合预测模型中的应用[J];东北农业大学学报;2005年06期
2 孙灏;杜培军;赵卫常;;基于多分类器组合的高分辨率遥感影像目标识别[J];地理与地理信息科学;2009年01期
3 高尚;梅亮;;基于支持向量机的电价组合预测模型[J];电力自动化设备;2008年11期
4 吴昌友;王福林;董志贵;索瑞霞;;改进粒子群优化算法在电力负荷组合预测模型中的应用[J];电网技术;2009年02期
5 刘汝杰,袁保宗,唐晓芳;用遗传算法实现模糊测度赋值的一种多分类器融合算法[J];电子学报;2002年01期
6 关健,刘大昕;一种基于多层感知机的无监督异常检测方法[J];哈尔滨工程大学学报;2004年04期
7 钱苏丽;何建敏;王纯麟;;基于改进支持向量机的电信客户流失预测模型[J];管理科学;2007年01期
8 盛昭瀚,柳炳祥;客户流失危机分析的决策树方法[J];管理科学学报;2005年02期
9 征荆,丁晓青,吴佑寿;基于最小代价的多分类器动态集成[J];计算机学报;1999年02期
10 蒋国瑞;司学峰;;基于代价敏感SVM的电信客户流失预测研究[J];计算机应用研究;2009年02期
中国重要会议论文全文数据库 前1条
1 柳炳祥;盛昭翰;;一种基于Rough集的客户流失风险分析方法[A];2002年中国管理科学学术会议论文集[C];2002年
【相似文献】
中国期刊全文数据库 前10条
1 刘足华;熊惠霖;;基于随机森林的目标检测与定位[J];计算机工程;2012年13期
2 董师师;黄哲学;;随机森林理论浅析[J];集成技术;2013年01期
3 王象刚;;基于K均值随机森林快速算法及入侵检测中的应用[J];科技通报;2013年08期
4 陈姝;彭小宁;;基于粒子滤波和在线随机森林分类的目标跟踪[J];江苏大学学报(自然科学版);2014年02期
5 罗知林;陈挺;蔡皖东;;一个基于随机森林的微博转发预测算法[J];计算机科学;2014年04期
6 王丽婷;丁晓青;方驰;;基于随机森林的人脸关键点精确定位方法[J];清华大学学报(自然科学版);2009年04期
7 李建更;高志坤;;随机森林针对小样本数据类权重设置[J];计算机工程与应用;2009年26期
8 张建;武东英;刘慧生;;基于随机森林的流量分类方法[J];信息工程大学学报;2012年05期
9 吴华芹;;基于训练集划分的随机森林算法[J];科技通报;2013年10期
10 张华伟;王明文;甘丽新;;基于随机森林的文本分类模型研究[J];山东大学学报(理学版);2006年03期
中国重要会议论文全文数据库 前8条
1 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
2 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
3 张天龙;梁龙;王康;李华;;随机森林结合激光诱导击穿光谱技术用于的钢铁分类[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
4 相玉红;张卓勇;;组蛋白去乙酰化酶抑制剂的构效关系研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
6 冯飞翔;冯辅周;江鹏程;刘菁;刘建敏;;随机森林和k-近邻法在某型坦克变速箱状态识别中的应用[A];第八届全国转子动力学学术讨论会论文集[C];2008年
7 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
8 张旺;范丽s,
本文编号:665713
本文链接:https://www.wllwen.com/jingjilunwen/xxjj/665713.html