基于数据挖掘的通信客户营销系统研究与应用
发布时间:2021-11-25 14:01
从“提速降费”到“携号转网”,近年来,国家在政策上正逐步加强对电信行业的管理,于此同时,移动互联网的高速发展也令电信行业市场竞争日趋激烈。在外部政策约束和内部市场竞争双重压力下,运营商面临着营收和净利润持续下滑,存量客户规模增速放缓等不利局面。步入2019年,随着5G商用的落地,运营商在全国范围内逐步实现了5G覆盖。5G时代的到来为运营商扭转当前竞争劣势带来了新的契机,如何做好电信业务推广,拉升企业营收,同时做好客户高效管理和优质服务,稳固客户份额,是当前电信运营商重要的发展方向。然而,当前电信运营商在客户管理和产品营销上存在模式较粗放,数据整合不够全面等不足,运营上缺乏统筹性指导,未能充分体现电信行业庞大的数据资源带来的运营优势。本文从电信运营商的核心需求出发,运用数据挖掘技术搭建通信客户营销系统,系统通过对海量电信客户数据进行挖掘分析,研究并提出基于价值的电信客户细分方法,优化客户运营模式和营销资源配置,并在此基础上进行电信流量产品推荐方法研究,确保提升营销成效和资源投放回报率,实现精细化运营。本文的主要研究工作和创新点包括:(1)结合电信客户的通信行为、消费习惯等特征,改进并提出...
【文章来源】:广东工业大学广东省
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
二元关联法流程图
图 2-1 二元关联法流程图 Figure 2-1 Flow chart of Binary Relevance 二是分类器链方法[35](Classifier Chains,CC),这类方法的核心思想是将多标签分类形式转为二元分类器链形式,分类器链法每次将前一个标签作为下一个标签分类器的输入,使标签信息在分类器之间传递。首先对样本 x 的 n 个标签进行排序,依次选择标签 作为预测类别,并将 + 1作为输入样本构建模型。这类方法可学习到标签间的依赖关系,泛化能力比二元关联法好,但标签间序列关系对模型性能有较大影响。
第二章相关理论与技术15三是标签集[34](LabelPowerset)法,本方法将客户的多个标签统一为一个类别,即对每一种标签的组合方式设为一类,此时,多标签分类问题则转为单一的多分类问题,实际应用时,若标签数量太多,其可能的组合类别会非常多,则训练数据会十分稀疏。图2-3标签集法流程图Figure2-3FlowchartofLabelPowerset除了上述问题转化方法,多标签分类还可在改编的分类算法上实现,常见的有ML-KNN、RankSVM[36]以及BPMLL[37]等,其中ML-KNN、RankSVM在小数据集上可以得到良好分类效果,但对大数据集的训练和计算过程相当占内存,因此不适合处理大样本;而BPMLL反向传播多标签学习则引入了新的误差函数降低运算时间,但同时,算法计算复杂度也会大大增加。在深度学习技术上,常通过对CNN、LSTM等神经网络模型上做自适应优化,实现多标签分类,这类方法目前在多标签文本处理、图像识别等领域表现更为优异。2.3.2ML-KNNML-KNN是一类常用多标签分类算法,算法由传统的K近邻(K-nearestneighbor,KNN)拓展而来,借鉴了K近邻算法的基本思想。ML-KNN算法设定标签在样本集中存在时,该标签值设为1,反之设为0,首先计算训练集中样本标签为1/0时的先验概率,再计算该样本的K个近邻样本中,对应标签为1/0时的条件后验概率,对于未知样本,ML-KNN用最大后验概率方法分别计算样本标签为1以及0时的概率,最后根据这两个概率预测样本标签值。对于给定的样本和对应标签集合,设()表示样本的K的近邻样本,则ML-KNN算法的主要实现步骤如下:
【参考文献】:
期刊论文
[1]多标签学习在智能推荐中的研究与应用[J]. 朱峙成,刘佳玮,阎少宏. 计算机科学. 2019(S2)
[2]汽车4S店TFM客户细分模型及其方法研究[J]. 谢鹏寿,张宽,范宏进,贵向泉,张恩展. 小型微型计算机系统. 2019(10)
[3]基于RFA模型和聚类分析的百度外卖客户细分[J]. 包志强,赵媛媛,赵研,胡啸天,高帆. 计算机科学. 2018(S2)
[4]优化初始聚类中心的改进K-means算法[J]. 唐东凯,王红梅,胡明,刘钢. 小型微型计算机系统. 2018(08)
[5]电信客户细分中基于聚类算法的数据挖掘技术研究[J]. 梁霄波. 现代电子技术. 2016(15)
[6]基于信息融合的电信客户流失预测研究[J]. 王建仁,李妮,段刚龙. 计算机工程与应用. 2016(10)
[7]基于优势关系粗糙集的电信客户价值评价方法[J]. 邓维斌,王国胤. 计算机应用研究. 2015(06)
本文编号:3518287
【文章来源】:广东工业大学广东省
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
二元关联法流程图
图 2-1 二元关联法流程图 Figure 2-1 Flow chart of Binary Relevance 二是分类器链方法[35](Classifier Chains,CC),这类方法的核心思想是将多标签分类形式转为二元分类器链形式,分类器链法每次将前一个标签作为下一个标签分类器的输入,使标签信息在分类器之间传递。首先对样本 x 的 n 个标签进行排序,依次选择标签 作为预测类别,并将 + 1作为输入样本构建模型。这类方法可学习到标签间的依赖关系,泛化能力比二元关联法好,但标签间序列关系对模型性能有较大影响。
第二章相关理论与技术15三是标签集[34](LabelPowerset)法,本方法将客户的多个标签统一为一个类别,即对每一种标签的组合方式设为一类,此时,多标签分类问题则转为单一的多分类问题,实际应用时,若标签数量太多,其可能的组合类别会非常多,则训练数据会十分稀疏。图2-3标签集法流程图Figure2-3FlowchartofLabelPowerset除了上述问题转化方法,多标签分类还可在改编的分类算法上实现,常见的有ML-KNN、RankSVM[36]以及BPMLL[37]等,其中ML-KNN、RankSVM在小数据集上可以得到良好分类效果,但对大数据集的训练和计算过程相当占内存,因此不适合处理大样本;而BPMLL反向传播多标签学习则引入了新的误差函数降低运算时间,但同时,算法计算复杂度也会大大增加。在深度学习技术上,常通过对CNN、LSTM等神经网络模型上做自适应优化,实现多标签分类,这类方法目前在多标签文本处理、图像识别等领域表现更为优异。2.3.2ML-KNNML-KNN是一类常用多标签分类算法,算法由传统的K近邻(K-nearestneighbor,KNN)拓展而来,借鉴了K近邻算法的基本思想。ML-KNN算法设定标签在样本集中存在时,该标签值设为1,反之设为0,首先计算训练集中样本标签为1/0时的先验概率,再计算该样本的K个近邻样本中,对应标签为1/0时的条件后验概率,对于未知样本,ML-KNN用最大后验概率方法分别计算样本标签为1以及0时的概率,最后根据这两个概率预测样本标签值。对于给定的样本和对应标签集合,设()表示样本的K的近邻样本,则ML-KNN算法的主要实现步骤如下:
【参考文献】:
期刊论文
[1]多标签学习在智能推荐中的研究与应用[J]. 朱峙成,刘佳玮,阎少宏. 计算机科学. 2019(S2)
[2]汽车4S店TFM客户细分模型及其方法研究[J]. 谢鹏寿,张宽,范宏进,贵向泉,张恩展. 小型微型计算机系统. 2019(10)
[3]基于RFA模型和聚类分析的百度外卖客户细分[J]. 包志强,赵媛媛,赵研,胡啸天,高帆. 计算机科学. 2018(S2)
[4]优化初始聚类中心的改进K-means算法[J]. 唐东凯,王红梅,胡明,刘钢. 小型微型计算机系统. 2018(08)
[5]电信客户细分中基于聚类算法的数据挖掘技术研究[J]. 梁霄波. 现代电子技术. 2016(15)
[6]基于信息融合的电信客户流失预测研究[J]. 王建仁,李妮,段刚龙. 计算机工程与应用. 2016(10)
[7]基于优势关系粗糙集的电信客户价值评价方法[J]. 邓维斌,王国胤. 计算机应用研究. 2015(06)
本文编号:3518287
本文链接:https://www.wllwen.com/jingjilunwen/xmjj/3518287.html