基于神经网络算法构建电信用户流失预测模型的研究
发布时间:2017-05-04 07:16
本文关键词:基于神经网络算法构建电信用户流失预测模型的研究,由笔耕文化传播整理发布。
【摘要】:随着大数据时代的到来,移动互联网快速发展使传统电信运营商面临着互联网企业以及同行业内的双重压力,运营商手中掌握着大量的用户数据,却苦于无法从数据中获得其潜在的商业价值,这对传统电信运营商转型提出了迫切的要求。使传统电信运营商必须向数据驱动的商业模式转变,从而提升企业的竞争力。国内电信企业将数据挖掘技术结合业务数据主要应用于产品的精确营销、客户分群、客户行为分析、客户流失预测、套餐制定以及电话欺诈等等。但大多都只是处于研究阶段,并未使用到实际生产当中,国内运营商对大数据和数据挖掘等技术的应用还处于起步阶段,还需要不断发展。对于企业来说,客户都是企业最重要的资源,如何最大程度保留有价值、价值高的客户是企业永恒的目标。一是通过价格优势或提出新产品来发展新的客户,二是通过提升服务和实施客户挽留、客户价值提升的政策最大限度的留住老客户,而第二种方法所需要的成本明显低于第一种,运营商们出于成本的考虑将重点放在客户挽留。而在现实生活中,用户的流失都是无预兆和没有规律可循的,只有实现用户的流失预测,及早发现可能流失的用户并对其采取正确的挽留措施,才能尽可能的保证企业的客户资源不流失。本文按照跨行业数据挖掘过程CRISP-DM的6个步骤,从电信某公司的多个子系统中提取出了客户信息、账户信息以及移动用户的语音、数据、增值业务等行为信息,通过数据集成、清洗、规约、转换等方法对数据集进行处理。使用BP神经网络算法实现了电信用户的流失预测,模型的预测命中率可以达到82.12%。同时使用Map Reduce的编程框架将算法在Hadoop平台上进行了部署,在保证了算法的准确度的情况下,解决了在单机计算量有限的问题,有效地提高了模型训练效率。实验表明了基于MapReduce的编程框架下的BP神经网络算法在处理海量数据时具有明显优势。
【关键词】:流失预测 数据挖掘 BP神经网络 大数据 Hadoop CRISP-DM
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F626;TP183
【目录】:
- 中文摘要3-4
- Abstract4-9
- 第一章 绪论9-17
- 1.1 研究背景9-12
- 1.1.1 电信运营商面临的挑战9-10
- 1.1.2 数据挖掘的发展10-11
- 1.1.3 数据挖掘技术在电信业的应用11-12
- 1.2 国内外研究现状12-14
- 1.2.1 国外研究现状12-13
- 1.2.2 国内研究现状13-14
- 1.3 主要研究内容14-15
- 1.4 文章的组织结构15-17
- 第二章 相关理论知识介绍17-25
- 2.1 数据挖掘过程17-19
- 2.1.1 跨行业数据挖掘过程CRISP-DM17-19
- 2.2 神经网络算法19-21
- 2.3 Hadoop21-25
- 2.3.1 分布式文件系统HDFS21-23
- 2.3.2 分布式计算框架MapReduce23-25
- 第三章 模型数据的准备25-43
- 3.1 商业理解25-27
- 3.1.1 用户流失的定义25-26
- 3.1.2 客户流失原因分析26
- 3.1.3 电信的三户模型26-27
- 3.2 数据理解27-31
- 3.2.1 确定数据分析窗口27-28
- 3.2.2 相关数据的选择28-31
- 3.3 数据准备31-43
- 3.3.1 数据集成31-32
- 3.3.2 数据清理32-35
- 3.3.3 数据规约35-36
- 3.3.4 数据变换36-37
- 3.3.5 数据的平衡问题37-38
- 3.3.6 重要属性的选择38-42
- 3.3.7 数据集的划分42-43
- 第四章 模型建立、评估与应用43-53
- 4.1 预测模型的建立43-48
- 4.1.1 BP神经网络学习算法43-45
- 4.1.2 网络结构的参数设定45-47
- 4.1.4 网络的训练过程47-48
- 4.2 模型的评估48-51
- 4.3 模型的部署与应用51-53
- 第五章 预测模型的Hadoop平台实现53-58
- 5.1 实验平台介绍53-54
- 5.2 预测模型的并行化54-55
- 5.3 实验结果分析55-57
- 5.4 小结57-58
- 第六章 总结与展望58-60
- 6.1 本文总结58-59
- 6.2 未来工作的展望59-60
- 参考文献60-63
- 研究生期间参与的项目63-64
- 致谢64
【相似文献】
中国期刊全文数据库 前10条
1 张赛民;周竹生;陈灵君;;应用一种改进BP神经网络算法预测密度曲线[J];物探化探计算技术;2007年06期
2 李淑慧;;改进的进化神经网络算法及其在入侵检测中的应用[J];现代电子技术;2010年01期
3 王治国;宋考平;张春鹤;刘刚;王爱明;;BP神经网络算法在单井流动单元识别中的应用[J];数学的实践与认识;2011年05期
4 ;BP神经网络算法的改进[J];电脑开发与应用;1995年02期
5 贺兴时,刘宇;BP神经网络算法在数字识别中的应用[J];西北纺织工学院学报;2000年04期
6 李广琼,蒋加伏;关于对BP神经网络算法改进的研究[J];常德师范学院学报(自然科学版);2003年02期
7 孙修东,李宗斌,陈富民;基于改进BP神经网络算法的多指标综合评价方法的应用研究[J];河南机电高等专科学校学报;2003年01期
8 王青海;BP神经网络算法的一种改进[J];青海大学学报(自然科学版);2004年03期
9 左付均,蔡自兴;基于神经网络算法的建设项目风险预测系统设计[J];广西科学院学报;2004年03期
10 李卫东;基于神经网络算法的工程技术人员综合评价方法的应用研究[J];太原科技大学学报;2005年02期
中国重要会议论文全文数据库 前10条
1 吕庆U,
本文编号:344648
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/344648.html