基于组合预测算法的电信客户流失预警模型研究
发布时间:2021-07-12 22:02
新时期下,电信企业的战略目标已经由新客户开发转向老客户保留。在越发成熟的电信市场,新客户的开发难度越来越大,需要消耗大量的人力和财力。最初很长一段时期,各运营商们花费大量的精力用于开拓新市场、开发新客户,而对客户保持关注度不够。开拓新市场势必花费大量的运营成本,这就造成了一定程度的客户虚增现象。有研究表明,开发新客户要比保留老客户花费更大的运营成本,但是给企业带来的收益不高。一个老客户会将自己的满意体验告诉邻近2-3人,将不满意体验告诉邻近8-10人,这将在很大程度上影响到企业的声誉。本文基于某市的宽带客户行为数据,依据该企业宽带客户的行为数据构建是否出账的预警模型。时间窗口选为五个月,其中前三个月为分析窗口,用于模型构建,第四个月为挽留窗口,用于企业采取措施进行保留,第五个月为预测窗口,即对客户是否出账实现隔月预测。本文的主要目标是建立一个组合模型来对客户是否流失进行隔月预测。组合模型是基于四种基分类器线性组合的分类算法,可以有效发挥各基模型的优点,提高模型的分类能力,帮助企业进行客户挽留,对提高企业收益具有重大意义。数据的选择具有严重的数据不均衡和属性较少的特点,在对数据进行缺失值...
【文章来源】:云南财经大学云南省
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数图
第二章客户流失预测模型概述18(2.24)假设,,且,是前步得到的一个常数,对最后一棵树的叶子节点求一阶导并令其等于0,则叶子节点的权值如公式(2.25)所示:(2.25)所以目标函数可以化简为:(2.26)从公式(2.26)可知,目标函数变成了仅与上一步有关的一个新的目标函数,利用上述的思想,基于最小化损失函数寻找最优分割点,并且循环此过程。XGBoost每轮迭代都会生成一颗树,使得损失不断减少,越来越接近真实值,使得分类结果非常好,而且XGBoost可以实现并行化处理,使得模型训练时间短,通过引入泰勒的二阶公式来求解损失函数,使得结果更加精确,除此之外模型中添加了正则项参数,可以有效降低模型的复杂度。三、神经网络模型传统的神经网络包括三个层级结构:输入层、隐藏层和输出层。层与层之间都存在着权重和激活函数,激活函数将线性模型映射为非线性模型,其中,模型中神经元的个数、权重值、连接方式以及激活函数的差别会形成不同的神经网络模型。且神经元结构如图2.2所示:图2.2神经元模型结构图
第二章客户流失预测模型概述19从图2.2中可以了解到这些神经元是具有方向性的,神经元之间由神经链连接,神经链表示一定的加权比重,模型的功能来自于神经元之间彼此的作用。神经网络内部的神经链和神经元存在着复杂的数学关系,模型在神经元中对输入的值与神经链上的权重进行求和,通过激励函数的作用得到模型预测的结果。而神经网络是在神经元网络的基础上演化来的,神经网络结构图如图2.3所示:图2.3神经网络结构图经典的神经网络包括三个层级结构,且层与层之间具有传递性,上一层的输出即是下一层的输入,+1项表示神经网络的偏置项,用于修正模型结构。输入层位于神经网络模型的第一级层级结构,用于数据的输入,是整个模型的起点层。隐藏层位于神经网络的第二级层级结构,隐藏层神经元通过从输入层接收的数据与神经链上的权重进行计算并将结果存储起来。并且与输出层连接,作为输出层的输入,自身并不与外界直接联系。输出层位于神经网络模型的最高层,用于接收上一层的输出,经过非线性函数的作用,输出结果。模型的结构越复杂。理论上在训练集上的表现越好,当面对复杂的问题,往往需要构建更复杂的网络结构,这包括神经元的个数和层的数量,即包含多个隐藏层的网络结构,如图2.4所示:图2.4多隐层神经网络模型
【参考文献】:
期刊论文
[1]基于深度神经网络的客户流失预测模型[J]. 马文斌,夏国恩. 计算机技术与发展. 2019(09)
[2]基于随机森林算法的客户流失模型[J]. 朱琦,朱正键,陈伦楷. 电信快报. 2019(04)
[3]基于One Class SVM的电信用户流失情况研究[J]. 简宋全,李青海,黄心蕊,秦于钦. 现代计算机(专业版). 2017(29)
[4]一种基于C5.0决策树的客户流失预测模型研究[J]. 张宇,张之明. 统计与信息论坛. 2015(01)
[5]基于ODR和BSMOTE结合的不均衡数据SVM分类算法[J]. 陶新民,童智靖,刘玉,付丹丹. 控制与决策. 2011(10)
[6]基于蚁群算法的成本敏感线性集成多分类器的客户流失研究[J]. 罗彬,邵培基,罗尽尧,刘独玉,夏国恩. 中国管理科学. 2010(03)
[7]电信业客户流失管理策略模型[J]. 夏国恩,邵培基. 电信科学. 2009(03)
[8]基于核主成分分析特征提取的客户流失预测[J]. 夏国恩. 计算机应用. 2008(01)
[9]CRM的客户生命周期价值与测度方法探讨[J]. 谢守祥,骆涛涛. 现代管理科学. 2007(08)
[10]基于客户价值的客户序位评价研究[J]. 戴俊良,刘承水. 中国管理科学. 2007(03)
博士论文
[1]电信运营企业客户流失预测与评价研究[D]. 迟准.哈尔滨工程大学 2013
[2]基于MMOI方法的电信客户流失预测与挽留研究[D]. 罗彬.电子科技大学 2010
[3]中国电信业流失客户赢回策略研究[D]. 刘勇.华中科技大学 2007
硕士论文
[1]基于重采样的代价敏感学习在网络贷款用户分类中的应用[D]. 郭冰楠.华南理工大学 2019
[2]基于多算法融合的电子商务客户流失预测算法研究[D]. 刘叶.昆明理工大学 2019
[3]DG电信公司宽带用户流失的预警模型构建[D]. 黄展正.华南理工大学 2018
[4]基于算法融合的客户流失预测方法研究[D]. 赵婷婷.东北财经大学 2018
[5]基于Stacking集成学习的浙江移动公司客户流失分层预测研究[D]. 汪贝贝.浙江工商大学 2018
[6]不均衡电信客户数据的分类问题研究[D]. 郭娜娜.西安理工大学 2017
[7]基于少数类样本重组的不平衡数据分类研究[D]. 李轩.湖南大学 2016
[8]电信客户流失预警模型的构建及应用研究[D]. 段佩.浙江工商大学 2015
[9]客户流失预测算法研究[D]. 王辉.广西师范大学 2015
[10]扬州移动公司在校大学生客户流失原因的调查研究[D]. 刘认.扬州大学 2015
本文编号:3280743
【文章来源】:云南财经大学云南省
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数图
第二章客户流失预测模型概述18(2.24)假设,,且,是前步得到的一个常数,对最后一棵树的叶子节点求一阶导并令其等于0,则叶子节点的权值如公式(2.25)所示:(2.25)所以目标函数可以化简为:(2.26)从公式(2.26)可知,目标函数变成了仅与上一步有关的一个新的目标函数,利用上述的思想,基于最小化损失函数寻找最优分割点,并且循环此过程。XGBoost每轮迭代都会生成一颗树,使得损失不断减少,越来越接近真实值,使得分类结果非常好,而且XGBoost可以实现并行化处理,使得模型训练时间短,通过引入泰勒的二阶公式来求解损失函数,使得结果更加精确,除此之外模型中添加了正则项参数,可以有效降低模型的复杂度。三、神经网络模型传统的神经网络包括三个层级结构:输入层、隐藏层和输出层。层与层之间都存在着权重和激活函数,激活函数将线性模型映射为非线性模型,其中,模型中神经元的个数、权重值、连接方式以及激活函数的差别会形成不同的神经网络模型。且神经元结构如图2.2所示:图2.2神经元模型结构图
第二章客户流失预测模型概述19从图2.2中可以了解到这些神经元是具有方向性的,神经元之间由神经链连接,神经链表示一定的加权比重,模型的功能来自于神经元之间彼此的作用。神经网络内部的神经链和神经元存在着复杂的数学关系,模型在神经元中对输入的值与神经链上的权重进行求和,通过激励函数的作用得到模型预测的结果。而神经网络是在神经元网络的基础上演化来的,神经网络结构图如图2.3所示:图2.3神经网络结构图经典的神经网络包括三个层级结构,且层与层之间具有传递性,上一层的输出即是下一层的输入,+1项表示神经网络的偏置项,用于修正模型结构。输入层位于神经网络模型的第一级层级结构,用于数据的输入,是整个模型的起点层。隐藏层位于神经网络的第二级层级结构,隐藏层神经元通过从输入层接收的数据与神经链上的权重进行计算并将结果存储起来。并且与输出层连接,作为输出层的输入,自身并不与外界直接联系。输出层位于神经网络模型的最高层,用于接收上一层的输出,经过非线性函数的作用,输出结果。模型的结构越复杂。理论上在训练集上的表现越好,当面对复杂的问题,往往需要构建更复杂的网络结构,这包括神经元的个数和层的数量,即包含多个隐藏层的网络结构,如图2.4所示:图2.4多隐层神经网络模型
【参考文献】:
期刊论文
[1]基于深度神经网络的客户流失预测模型[J]. 马文斌,夏国恩. 计算机技术与发展. 2019(09)
[2]基于随机森林算法的客户流失模型[J]. 朱琦,朱正键,陈伦楷. 电信快报. 2019(04)
[3]基于One Class SVM的电信用户流失情况研究[J]. 简宋全,李青海,黄心蕊,秦于钦. 现代计算机(专业版). 2017(29)
[4]一种基于C5.0决策树的客户流失预测模型研究[J]. 张宇,张之明. 统计与信息论坛. 2015(01)
[5]基于ODR和BSMOTE结合的不均衡数据SVM分类算法[J]. 陶新民,童智靖,刘玉,付丹丹. 控制与决策. 2011(10)
[6]基于蚁群算法的成本敏感线性集成多分类器的客户流失研究[J]. 罗彬,邵培基,罗尽尧,刘独玉,夏国恩. 中国管理科学. 2010(03)
[7]电信业客户流失管理策略模型[J]. 夏国恩,邵培基. 电信科学. 2009(03)
[8]基于核主成分分析特征提取的客户流失预测[J]. 夏国恩. 计算机应用. 2008(01)
[9]CRM的客户生命周期价值与测度方法探讨[J]. 谢守祥,骆涛涛. 现代管理科学. 2007(08)
[10]基于客户价值的客户序位评价研究[J]. 戴俊良,刘承水. 中国管理科学. 2007(03)
博士论文
[1]电信运营企业客户流失预测与评价研究[D]. 迟准.哈尔滨工程大学 2013
[2]基于MMOI方法的电信客户流失预测与挽留研究[D]. 罗彬.电子科技大学 2010
[3]中国电信业流失客户赢回策略研究[D]. 刘勇.华中科技大学 2007
硕士论文
[1]基于重采样的代价敏感学习在网络贷款用户分类中的应用[D]. 郭冰楠.华南理工大学 2019
[2]基于多算法融合的电子商务客户流失预测算法研究[D]. 刘叶.昆明理工大学 2019
[3]DG电信公司宽带用户流失的预警模型构建[D]. 黄展正.华南理工大学 2018
[4]基于算法融合的客户流失预测方法研究[D]. 赵婷婷.东北财经大学 2018
[5]基于Stacking集成学习的浙江移动公司客户流失分层预测研究[D]. 汪贝贝.浙江工商大学 2018
[6]不均衡电信客户数据的分类问题研究[D]. 郭娜娜.西安理工大学 2017
[7]基于少数类样本重组的不平衡数据分类研究[D]. 李轩.湖南大学 2016
[8]电信客户流失预警模型的构建及应用研究[D]. 段佩.浙江工商大学 2015
[9]客户流失预测算法研究[D]. 王辉.广西师范大学 2015
[10]扬州移动公司在校大学生客户流失原因的调查研究[D]. 刘认.扬州大学 2015
本文编号:3280743
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3280743.html