移动客户离网组合预测模型研究
发布时间:2021-04-07 00:14
随着电信业务的扩张,用户市场趋近饱和,三大运营商用户增长的方向转移到对方的存量用户上。携号转网政策的落实和5G建设步伐的加快,都迫使运营商重视和加大用户留存的投入。存量用户的规模关系到企业的切实利益,降低客户流失迫在眉睫。以往研究大多聚焦于单一预测模型的构建,随着机器学习技术的广泛应用,本文在前人研究的基础上,探索基于集成学习思想的组合预测模型的构建方法。本文以集成学习思想为基础,创新性地构建了应用Stacking方法的离网组合预测模型,借助某移动分公司真实的业务数据,依次对业务数据进行数据清洗、属性扩展、属性筛选等操作,采用直方图检验和相关系数检验方法,最终选出了 12个相关性最高的特征属性,通过划分训练集与测试集,采用过抽样方法处理训练集的非平衡数据,利用组合模型对训练集数据进行学习,同时对测试集数据进行预测,最后计算相应的评估指标得到组合模型的准确率、覆盖率、Fl分数及ROC曲线,通过与单一模型的相关指标对比分析,验证了本文建立的组合模型在客户流失预测上具有较好的预测表现。借助模型识别出目标离网客户后,需要及时开展客户挽留营销,才能维系住存量用户。本文结合电信市场发展趋势,设计了...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图3-1组合模型流程结构图??模型具体的实现过程如下:??
、??!?输出??图3-1组合模型流程结构图??模型具体的实现过程如下:??假设原始数据经过数据处理后,得到的样本集为X{Xl,X2,x3...xn},其中??Xl,X2,X3...Xm为用户的特征属性,其中每个属性Xm下有11个样本,离网预测组合??模型的建模操作步骤为:??第一步,数据处理,确定样本属性集;??第二步,调整参数,构建决策树、神经网络、SVM单一预测模型;??将分别输入模型,调整模型参数,得到决策树的预测结果序??列YJyuju,…,yln},祌经网络的预测结果序列Y2{y21,y22,...y2n},SVM算法的预??测结果序列?Y3{y31
?北京邮电大学工学硕士学位论文4.2.2数据描述性分析??通过描述性统计方法可以从整体上发现数据指标的差异性,挖掘数据规律,??对于指标筛选、数据清理以及训练模型有非常好的帮助。笔者通过对原始数据行观察,选取了部分指标进行特性分析,以判断数据是否可直接用于模型的构1)用户在网时长分布??用户的在网时长属性指用户加入移动该分公司后持续在网的月数,本文收到的用户数据显示,如图4-2用户在网时长分布曲线图,大部分用户在网时长布在24-58之间,正常在网用户与己离网用户的在网时长分布趋势相近,说明网时长分布上用户离网行为差异化不明显。???
本文编号:3122422
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图3-1组合模型流程结构图??模型具体的实现过程如下:??
、??!?输出??图3-1组合模型流程结构图??模型具体的实现过程如下:??假设原始数据经过数据处理后,得到的样本集为X{Xl,X2,x3...xn},其中??Xl,X2,X3...Xm为用户的特征属性,其中每个属性Xm下有11个样本,离网预测组合??模型的建模操作步骤为:??第一步,数据处理,确定样本属性集;??第二步,调整参数,构建决策树、神经网络、SVM单一预测模型;??将分别输入模型,调整模型参数,得到决策树的预测结果序??列YJyuju,…,yln},祌经网络的预测结果序列Y2{y21,y22,...y2n},SVM算法的预??测结果序列?Y3{y31
?北京邮电大学工学硕士学位论文4.2.2数据描述性分析??通过描述性统计方法可以从整体上发现数据指标的差异性,挖掘数据规律,??对于指标筛选、数据清理以及训练模型有非常好的帮助。笔者通过对原始数据行观察,选取了部分指标进行特性分析,以判断数据是否可直接用于模型的构1)用户在网时长分布??用户的在网时长属性指用户加入移动该分公司后持续在网的月数,本文收到的用户数据显示,如图4-2用户在网时长分布曲线图,大部分用户在网时长布在24-58之间,正常在网用户与己离网用户的在网时长分布趋势相近,说明网时长分布上用户离网行为差异化不明显。???
本文编号:3122422
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/3122422.html