当前位置:主页 > 经济论文 > 经济理论论文 >

基于数据挖掘技术构建电信4G客户预测模型的研究

发布时间:2017-06-10 14:02

  本文关键词:基于数据挖掘技术构建电信4G客户预测模型的研究,由笔耕文化传播整理发布。


【摘要】:2013年12月,中国正式进入4G时代。与此同时,运营商之间的4G客户竞争也进入白热化阶段。随着数据挖掘技术的广泛应用和运营商积累的越来越多的数据,如何利用数据挖掘技术手段处理电信大数据,受到越来愈多人的关注与研究。4G时代,针对电信业客户关系管理的需要,在现有的数据仓库技术和数据挖掘技术基础上,帮助运营商找出潜在的4G客户,扩大其市场占有份额,对电信运营商来讲具有很重大的现实意义和经济效益。本文研究的4G客户预测问题正是在这样一个时代背景下旨在为扩大运营商的4G客户规模而提出的。本文所采用的数据集来自于某电信公司。最主要的目标是建立一个准确率高的、实用性强的电信4G客户预测模型。模型的建立以数据挖掘的CRISP-DM方法论为基础。首先,在模型构建的准备阶段,本文对原始的电信数据进行了集成、清洗、规约、转换、分割等一系列的数据预处理工作,初步筛选并构建了模型的预测指标体系。然后,建立决策树、Logistics回归、SVM这三种4G客户预测模型,经过多次的模型训练与对比,最终选择出效果最好的决策树模型应用于电信4G客户预测。在模型应用阶段,参照预测模型计算出的所有客户得分情况,重点关注的对象是那些得分较高的客户,对这部分潜在的4G客户进行有针对性的业务推广和精确营销,从而达到扩大4G客户规模的目的。最后,本文还搭建了一个具有9个节点的Hadoop集群,实现了决策树C4.5算法的并行化,有效地解决了单机无法处理大规模数据的问题,验证了Hadoop平台在处理电信大数据方面的高效性与可扩展性。本文是把数据挖掘理论和实际项目相结合一个典型案例,利用数据挖掘的相关技术建立了电信4G客户预测模型。结果表明,所建立的模型是基本符合电信实际需求的,能够提供有价值的预测信息给相关的决策人员和市场营销人员,对电信运营商扩大4G客户规模具有重大的现实意义。
【关键词】:数据挖掘 电信大数据 4G客户预测模型 决策树算法 Logistic回归 SVM算法 Hadoop
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F0;TP311.13
【目录】:
  • 中文摘要3-4
  • Abstract4-8
  • 第一章 绪论8-15
  • 1.1 研究背景8-11
  • 1.1.1 大数据时代运营商面临的机遇与挑战8-9
  • 1.1.2 数据挖掘技术的兴起与应用9-10
  • 1.1.3 数据挖掘技术在电信业中的应用10-11
  • 1.2 国内外研究现状11-13
  • 1.2.1 国外研究现状11-12
  • 1.2.2 国内研究现状12-13
  • 1.3 本文主要工作13-14
  • 1.4 论文组织机构14-15
  • 第二章 相关理论技术概述15-23
  • 2.1 数据挖掘过程15-16
  • 2.2 数据挖掘技术16-20
  • 2.2.1 决策树16-18
  • 2.2.2 Logistic回归技术18-19
  • 2.2.3 支持向量机SVM19-20
  • 2.3 Hadoop介绍20-23
  • 2.3.1 分布式文件系统HDFS20-21
  • 2.3.2 分布式计算框架MapReduce21-23
  • 第三章 模型的样本数据的准备23-42
  • 3.1 模型的商业理解24-25
  • 3.2 数据理解25-28
  • 3.2.1 确定分析窗口25-26
  • 3.2.2 确定相关数据字段26-28
  • 3.3 数据准备28-42
  • 3.3.1 数据集成29-30
  • 3.3.2 数据清洗30-32
  • 3.3.3 数据规约32-34
  • 3.3.4 数据转换34-35
  • 3.3.5 数据的平衡问题35-36
  • 3.3.6 数据预测指标体系的构建36-40
  • 3.3.7 拆分数据集40-42
  • 第四章 预测模型的建立、评估及应用42-48
  • 4.1 预测模型的建立42-43
  • 4.2 模型评估43-46
  • 4.3 模型的部署与应用46-48
  • 第五章 基于Hadoop平台构建电信4G客户预测模型48-53
  • 5.1 Hadoop平台描述48-49
  • 5.2 基于MapReduce实现决策树C4.5的并行化49-51
  • 5.3 实验结果对比分析51-53
  • 第六章 总结与展望53-55
  • 6.1 本文总结53-54
  • 6.2 未来工作的展望54-55
  • 参考文献55-58
  • 研究生期间参与的项目58-59
  • 致谢59

【引证文献】

中国重要会议论文全文数据库 前1条

1 王超;辛阳;;C5.0分类算法在网络入侵检测中的应用[A];第十三届中国科协年会第11分会场-中国智慧城市论坛论文集[C];2011年


  本文关键词:基于数据挖掘技术构建电信4G客户预测模型的研究,,由笔耕文化传播整理发布。



本文编号:438701

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjililun/438701.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6b8af***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com