当前位置:主页 > 科技论文 > 软件论文 >

基于数据挖掘的运营商用户流失预测研究与应用

发布时间:2021-01-31 10:49
  用户是电信运营商利益的核心。面对激烈的业内竞争、日益饱和的电信市场和互联网大潮的不断冲击,提前预测用户流失倾向,有针对性地挽留用户,对提高运营商收益十分重要。数据挖掘是从数据中获取有价值信息的重要手段,用数据挖掘技术对运营商存储的海量数据进行用户流失预测建模,可以准确地预测用户流失倾向。本文基于数据挖掘技术对运营商计费系统中数据进行分析,构建运营商用户流失预测系统,预测用户是否流失及流失的概率,使运营商制定用户挽留策略更有针对性。论文主要工作包括:1.基于数据挖掘过程,对运营商计费系统中数据进行预处理、特征构建和选择,以梯度提升算法LightGBM做为分类器,提出了运营商用户流失预测模型,并对基于LightGBM的用户流失预测模型进行了性能测试。结果表明,本文提出模型的正确率、召回率、调和均值(F1)和曲线下面积(AUC)均优于常用的逻辑回归、支持向量机、决策树和随机森林模型。在此基础上,本文搭建了便于实际部署和应用的用户流失预测系统,采用运营商计费系统中提取的用户真实数据进行了系统测试。2.本文从数据处理方面对运营商用户流失预测数据不均衡问题进行了研究,提出了基于生成对抗网络的过采样... 

【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校

【文章页数】:104 页

【学位级别】:硕士

【部分图文】:

基于数据挖掘的运营商用户流失预测研究与应用


图2-1?CRISP-DM数据挖掘过程??

结构图,策略,结构图,分类器


的基分类器应该同时具备精准性和多样性的特点。一般集成分类器具有比单个分??类器更强的泛化能力。从基分类器生成策略考虑,集成学习方法主要可以分为??Bagging策略、Boosting策略和Stacking策略三种,具体结构分别如图2-2、图2-3??和图2-4所示。??(1)?Bagging?策略??Bagging策略是一种并行化训练基分类器的方法,通过可重复采样的方式,生??成多个具有一定差异的样本子集,然后用这些不同的样本子集分别训练多个基分??类器,再对这些分类器进行集成得到具有一定多样性的集成分类器。Bagging策略??结构如图2-2所示,该策略简单有效,其中随机森林就是它的典型代表。由于??Bagging策略采取并行化结合方式,当基分类器相互独立时,可以显著降低集成后??分类器的方差。?? ̄H?基分类器1?? ̄ ̄八枉女—I? ̄ ̄入择士?|训练?????—基分类器2集成分类器??机?S??采????策??样.?.略??m个样本?训练??H?基分类器7??图2-2?Bagging策略结构图??Figure?2-2?the?Structure?of?Bagging?Strategy??(2)?Boosting?策略??与Bagging并行化策略不同,Boosting策略采用串行的方式训练基分类器,下??14??

结构图,策略,结构图,分类器


?一个分类器的训练基于前一个分类器训练结果,分类器之间具有很强的相关性,??因此,Boosting策略降低的是集成分类器的偏差。Boosting策略结构如图2-3所示,??每一轮基分类器训练时根据上一轮分类器的误差调整训练样本的权重,提高误差??率高的样本的权重,使得误差率高的样本获得更多的重视。AdaBoost、GBDT等??算法都属于Boosting策略算法。??基分類丨h??根据基分类器1误差更新样本权重D(2>???——1?训练?, ̄ ̄??—??f权重D(2_)?J——?——?基分类器2??集成分类器??根据基分^器2误差更新样本权^D(3)?2?????口??????.略

【参考文献】:
期刊论文
[1]论电子商务通信运营商存量客户的维系[J]. 李尚琛.  中国市场. 2018(04)
[2]中国电信产业的外部分析[J]. 于可慧.  中国管理信息化. 2014(02)

博士论文
[1]集成学习中若干关键问题的研究[D]. 王清.复旦大学 2011

硕士论文
[1]基于生成对抗网络的图像类别不平衡问题数据扩充方法[D]. 俞彬.华南理工大学 2018
[2]电信客户细分研究[D]. 何灵.西南交通大学 2016
[3]数据挖掘在电信运营商客户关系管理中的应用[D]. 张隽.上海交通大学 2015
[4]基于数据挖掘的电信反欺诈管理系统的设计与实现[D]. 郭红宇.电子科技大学 2012
[5]基于数据挖掘的个性化营销算法的设计与实现[D]. 吴晓黎.北京邮电大学 2010



本文编号:3010720

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3010720.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户00034***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com