当前位置:主页 > 管理论文 > 营销论文 >

面向不平衡数据集的分类算法研究及其在通信智能运营方面的应用

发布时间:2020-07-19 15:32
【摘要】:移动互联网的发展促使通信运营商将原有的以网络为核心的通信运营模式改变为以客户体验为中心的新型价值模式,通过数据挖掘实现以客户体验管理为中心的通信智能运营已经成为一种必然的趋势。通信智能运营中的客户流失预警和终端精准营销是典型的不平衡数据分类问题,因此,面向不平衡数据集的分类算法研究及其在通信智能运营中的应用具有实用意义。本文针对不平衡数据集的分类算法进行研究,所做的主要研究工作包括以下方面:首先,为解决不平衡数据集的分类问题,提出了一种基于近邻样本分布和泊松分布的改进合成少数类过采样(SMOTE:Synthetic Minority Oversampling Technique)算法,针对 SMOTE 算法生成新样本时不考虑数据分布、生成新样本过程不可控、丢弃多数类信息的问题,在生成新样本的时候引进和数据分布有关的参数,对合成样本的偏离程度进行有效调节,仿真结果验证了所提算法的有效性;其次,针对k最近邻(kNN:k-Nearest Neighbor)分类算法的算法复杂度过高的问题,提出了一种基于预分类的kNN改进算法(kP:kNN algorithm based on Pre-classification),通过删除数据集中特征不明显的数据样本来减少算法时间复杂度,仿真结果验证了所提算法的有效性。最后,从通信智能运营实际应用的角度出发,针对客户流失数据和终端营销数据,采用基于近邻样本分布和泊松分布的改进SMOTE算法(SPDDN:SMOTE algorithm based on Poisson Distribution and the Distribution of Neighborhoods)和kP算法进行数据挖掘和分析,验证了上述所提算法的有效性,为通信智能运营中面向不平衡数据集的分类方法提供了有效的解决方案。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F626;TP311.13
【图文】:

客户流失,商业,数据


图3-2邋丫对SPDDN算法的AUC的影响(客户流失数据)逡逑

商业,客户流失,数据


0逦2逦4逦6逦8邋10邋12邋14邋16邋18邋20邋22邋24邋26邋28邋30邋32邋34邋36邋38邋40逡逑V逡逑图3-2邋丫对SPDDN算法的AUC的影响(客户流失数据)逡逑0.636逡逑0.634逦j赁逡逑0.632逦TIV-逡逑U邋°-63逡逑<邋0.628逡逑0.626逦N.逡逑0.624逦,逡逑0.622逡逑0逦0.5逦1逦1.5逦2逦2.5逦3逦3.5逦4逡逑V逡逑图3-3邋丫对SPDDN算法的AUC的影响(电商业务营销ex据)逡逑23逡逑

原理图,类域,数据样本,分类算法


近邻的标签来判断数据样本所属的标签。々NN的算法原理为:通过在训练集中逡逑寻找A个最近的数据样本,然后对A个近邻的类别标签进行投票,按照少数服从逡逑多数的原则得出最后的投票结果作为数据样本最后的分类结果,如图4-1[541。逡逑训练集.‘逡逑,/邋廔测.逡逑'、、■逡逑'、、、、、…一,’逡逑图4-1々NN邻分类算法原理图逡逑由r邋々NN方法fe要靠近邻的数据样本,而+是靠判别类域的方法来确定所逡逑属类别,因此在数据集的类域交叉或重叠较多的怙况K,邋ANN方法往往更为适逡逑八逡逑a邋0逡逑々NN算法在特征空N中寻找邻居的度m泞式包枯距离度和相似度度量,逡逑距离度量用于衡最样本在特征空间种存在的差异,如粜样本之间的距离越远则说逡逑明样本之间焌差异越大。相似度度

本文编号:2762604

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/2762604.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e9a7f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com