基于机器学习的电信网络用户行为分析研究
本文选题:聚类 + 聚类有效性 ; 参考:《北京邮电大学》2014年硕士论文
【摘要】:随着移动互联网时代的到来以及移动智能设备的普及,传统的电信业务模式和用户能够获得的服务内容发生了显著的变化。一方面,电信运营商能够给用户提供更为丰富的服务内容,各种新业务不断涌现;另一方面,用户可以根据自己的个人需求和喜好选择不同的服务内容和模式。 电信运营商多元化的服务和用户数目的迅速增长产生了海量数据。这些海量数据中有大量的用户行为数据,这些数据具有巨大的价值,如何利用好这些海量的用户行为数据是电信运营商的一个新挑战。本文的主要创新点如下: 首先,本文研究了如何利用机器学习中的相关技术针对电信业务用户行为数据进行用户行为的分析和挖掘,并且提出一种基于频繁模式的聚类有效性指数。新提出的聚类有效性指数不再采用传统聚类有效性指数经常利用的内聚性度量和分离性度量而是基于统计逻辑推理度量。它克服了传统聚类有效性指数的一些固有不足。文章将新提出的聚类有效性指数与特定聚类算法结合,形成了一种自适应聚类方法。这种自适应聚类方法能够从具有不同初始化参数的多个聚类过程中选择一个最合理的初始化参数和相应的聚类结果。 其次,本文将提出的自适应聚类方法应用于人工数据集和UCI (UC Irvine)数据集进行理论仿真和分析。对比实验结果表明,在人工数据集和UCI数据集上,新提出的有效性指数具有较好的性能。然后,利用本文提出的自适应聚类方法对中国某运营商某省级公司提供给本实验室的移动业务用户行为数据实施了特定的自适应聚类分析任务,结果表明本文提出的新聚类有效性指数和自适应聚类方法能够有效地应用于真实的电信业务数据以分析用户行为,具有实际应用价值。
[Abstract]:With the advent of the mobile Internet era and the popularity of mobile intelligent devices, the traditional telecommunication service mode and the service content that users can obtain have changed significantly. On the one hand, telecom operators can provide users with more abundant service content and a variety of new services are emerging; on the other hand, users can choose different service content and mode according to their personal needs and preferences. The diversified services of telecom operators and the rapid growth of the number of users have produced huge amounts of data. There are a lot of user behavior data in these massive data, these data have great value, how to make good use of these massive user behavior data is a new challenge for telecom operators. The main innovations of this paper are as follows: Firstly, this paper studies how to analyze and mine the user behavior data based on the related technology of machine learning, and proposes a clustering validity index based on frequent pattern. The new clustering validity index is based on the statistical logic reasoning instead of using the cohesion and separation measures which are often used by the traditional clustering validity indices. It overcomes some inherent shortcomings of traditional clustering validity index. In this paper, an adaptive clustering method is developed by combining the new clustering validity index with a specific clustering algorithm. This adaptive clustering method can select one of the most reasonable initialization parameters and corresponding clustering results from multiple clustering processes with different initialization parameters. Secondly, the proposed adaptive clustering method is applied to the theoretical simulation and analysis of artificial data sets and UCI UC Irvine data sets. The experimental results show that the proposed validity index has better performance on artificial data sets and UCI datasets. Then, using the adaptive clustering method proposed in this paper, we implement a specific adaptive clustering analysis task for mobile user behavior data provided to our laboratory by a provincial company of a Chinese operator. The results show that the new clustering validity index and adaptive clustering method proposed in this paper can be effectively applied to real telecom service data to analyze user behavior.
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN929.5;TP393.01;TP181
【共引文献】
相关期刊论文 前10条
1 张彦波;郑正奇;李明;;WSNs中采用动态模阈值检测DDoS攻击(英文)[J];传感技术学报;2008年07期
2 刘小芳;何彬彬;李小文;;基于半监督核模糊c-均值算法的北京一号小卫星多光谱图像分类[J];测绘学报;2011年03期
3 何力;黄薇;刘丹;;基于聚类分析方法的节水型社会分区研究[J];长江科学院院报;2010年04期
4 黄红星;阙树福;黄习培;田立;;模糊蚁群聚类及其在数据挖掘中的应用[J];福建电脑;2007年11期
5 刘克准;廖志芳;;数据挖掘中聚类算法综述[J];福建电脑;2008年08期
6 朱林;雷景生;毕忠勤;徐菲菲;;模糊加权流数据软子空间的聚类算法[J];上海电力学院学报;2013年06期
7 王昱;;基于组合分类的消费者信用评估[J];管理工程学报;2015年01期
8 石旭东,付宜利,代勇,马玉林;基于模糊聚类的设备分组技术[J];哈尔滨工业大学学报;2001年03期
9 张敞;王园园;赵裕啸;伍章俊;;一种基于信息熵的聚类结果评价方法[J];合肥工业大学学报(自然科学版);2011年08期
10 方怡;王君;王晓茹;;基于暂态稳定评估的数据挖掘预处理[J];机电工程;2007年10期
相关会议论文 前1条
1 刘通;张宇献;;基于加权平均数的模糊聚类有效性函数[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
相关博士学位论文 前10条
1 刘小芳;基于核理论的遥感图像分类方法研究[D];电子科技大学;2011年
2 吕宗磊;对聚类及聚类评价若干问题的研究[D];南京航空航天大学;2009年
3 唐海燕;电梯交通分析及电梯优化控制方法研究[D];哈尔滨工业大学;2010年
4 陈新国;数字系统微弱泄漏电磁波信号检测方法研究[D];华中科技大学;2012年
5 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年
6 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
7 王晓丹;基于模糊聚类及神经网络的纹理分割方法研究[D];西北工业大学;2000年
8 杨兵;人—机交互中手绘图形的联机识别方法研究[D];西安电子科技大学;2001年
9 孔敏;关联图的谱分析及谱聚类方法研究[D];安徽大学;2006年
10 卿铭;模糊熵及其在模糊系统优化中的应用[D];西南交通大学;2006年
相关硕士学位论文 前10条
1 孙洋;基于免疫遗传算法和粒子群算法的聚类研究[D];长沙理工大学;2010年
2 刘坤朋;数据挖掘中聚类算法的研究[D];长沙理工大学;2010年
3 白霜;DNA序列的最大频繁模式挖掘[D];南昌大学;2010年
4 刘强;基于FCM算法的多层钢框架模糊优化设计[D];山东建筑大学;2011年
5 张艳昌;基于信息论的时间序列聚类算法研究及应用[D];大连理工大学;2011年
6 孔明明;无线电干扰信号发现与识别的研究[D];西华大学;2010年
7 席妍妍;基于Hellinger距离的视觉信息的汉语语义习得[D];北京邮电大学;2011年
8 童波;基于MFGS方法图像最佳分割数的研究[D];南京理工大学;2011年
9 李晓丽;不确定性数据挖掘算法设计[D];电子科技大学;2011年
10 苏璇;改进的模糊聚类算法及其在电信欠费数据中的应用研究[D];天津理工大学;2011年
,本文编号:1985896
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1985896.html