基于一般化关联规则的通信运营商离网数据挖掘
发布时间:2023-11-03 18:49
近年来通信运营商的业务发展增速明显放缓,保证用户数的关注点已从增加新用户转移到如何去保有存量用户中。其中的一个策略就是为从海量的存量用户数据中分辨出那些有离网趋势的用户,采用的方法是对那些已处于离网的用户(即停拆机状态用户)的相关数据进行分析,找出这些用户离网与其他事务间的某些关联,找到他们离网的原因。这在行业内称为适用关联规则的数据挖掘。经典关联规则算法只能挖掘正频繁项集和正关联规则,因此无法反映项目A不发生对项目B的促进关系,即:-A?B,以及项目A发生对项目B发生的抑制关系,即:A?-B等。而运营商数据中包含大量未实名、未绑定套餐、未参加补贴等负项目,同时要研究各项目对用户不活跃、不出账、不计收等负项目的影响,因此需要对经典关联规则算法进行优化,使之能够同时挖掘正负频繁项集,生成前后件包含正负项的更一般化的关联规则,进而应用一般化关联规则对通信离网用户数据进行挖掘。本文首先分析了经典关联规则挖掘算法的关键思路,基于传统关联规则算法针对通信运营商离网用户数据的特点引入所谓“一般化关联规则”,提出了“关联规则算法的一般化”、“数值属性离散化”以及“支持度-置信度框架的完善”三个优化方...
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 选题背景及意义
1.1.1 选题背景
1.1.2 选题意义
1.2 研究现状及热点
1.2.1 大数据研究现状
1.2.2 运营商大数据挖掘现状
1.3 论文主要内容及结构安排
1.3.1 论文的主要研究内容
1.3.2 论文的结构安排
第二章 经典关联规则算法研究
2.1 关联规则算法概述
2.2 静态关联规则挖掘算法
2.3 动态关联规则挖掘算法
2.3.1 数据增量更新算法FUP
2.3.2 阈值动态更新算法IUA
2.4 其他类型的关联规则挖掘算法研究
2.4.1 负关联规则挖掘
2.4.2 数值关联规则挖掘
2.4.3 多维关联规则挖掘
2.5 本章总结
第三章 适合通信运营商数据挖掘的关联规则算法实现
3.1 通信运营商数据特点及算法优化思路
3.2 关联规则挖掘算法的一般化
3.2.1 现有正关联规则挖掘算法一般化方法的缺陷
3.2.2 包含计数器结构的一般化关联规则算法
3.3 数值属性离散化算法的优化
3.3.1 等宽离散法
3.3.2 等深离散法
3.3.3 最小距离离散法
3.4 “支持度-置信度”框架的优化
3.4.1 “支持度-置信度”框架缺陷
3.4.2 兴趣度模型
3.5 GAPI算法设计及实现
3.5.1 频繁项集挖掘中算法设计和验证
3.5.2 关联规则生成中的算法设计和验证
3.5.3 GAPI算法实现
3.6 本章总结
第四章 基于GAPI算法的运营商离网用户数据挖掘实验
4.1 通信运营商数据挖掘步骤
4.2 数据采集及预处理
4.2.1 数据采集及环境准备
4.2.2 数据收敛
4.2.3 数据预处理
4.2.4 完成预处理
4.3 GAPI算法数据挖掘实验
4.3.1 挖掘频繁项集
4.3.2 生成关联规则
4.3.3 挖掘有用知识
4.4 GAPI算法挖掘实验结果分析
4.4.1 频繁项集挖掘结果分析
4.4.2 关联规则生成结果分析
4.5 本章总结
第五章 基于频繁模式树的算法进一步优化及实验
5.1 FP-Growth算法的频繁模式树架构分析
5.2 基于频繁模式树的一般化关联规则算法GFP算法
5.2.1 FP-Growth算法优化思路及GFP算法的提出
5.2.2 GFP算法有效性验证
5.2.3 GFP算法的JAVA实现
5.3 基于GFP算法的通信运营商数据挖掘实验
5.4 GFP算法挖掘实验结果分析
5.5 本章总结
第六章 总结与展望
6.1 论文总结
6.2 未来展望
参考文献
附录
致谢
攻读学位期间发表的学术论文
本文编号:3859694
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 选题背景及意义
1.1.1 选题背景
1.1.2 选题意义
1.2 研究现状及热点
1.2.1 大数据研究现状
1.2.2 运营商大数据挖掘现状
1.3 论文主要内容及结构安排
1.3.1 论文的主要研究内容
1.3.2 论文的结构安排
第二章 经典关联规则算法研究
2.1 关联规则算法概述
2.2 静态关联规则挖掘算法
2.3 动态关联规则挖掘算法
2.3.1 数据增量更新算法FUP
2.3.2 阈值动态更新算法IUA
2.4 其他类型的关联规则挖掘算法研究
2.4.1 负关联规则挖掘
2.4.2 数值关联规则挖掘
2.4.3 多维关联规则挖掘
2.5 本章总结
第三章 适合通信运营商数据挖掘的关联规则算法实现
3.1 通信运营商数据特点及算法优化思路
3.2 关联规则挖掘算法的一般化
3.2.1 现有正关联规则挖掘算法一般化方法的缺陷
3.2.2 包含计数器结构的一般化关联规则算法
3.3 数值属性离散化算法的优化
3.3.1 等宽离散法
3.3.2 等深离散法
3.3.3 最小距离离散法
3.4 “支持度-置信度”框架的优化
3.4.1 “支持度-置信度”框架缺陷
3.4.2 兴趣度模型
3.5 GAPI算法设计及实现
3.5.1 频繁项集挖掘中算法设计和验证
3.5.2 关联规则生成中的算法设计和验证
3.5.3 GAPI算法实现
3.6 本章总结
第四章 基于GAPI算法的运营商离网用户数据挖掘实验
4.1 通信运营商数据挖掘步骤
4.2 数据采集及预处理
4.2.1 数据采集及环境准备
4.2.2 数据收敛
4.2.3 数据预处理
4.2.4 完成预处理
4.3 GAPI算法数据挖掘实验
4.3.1 挖掘频繁项集
4.3.2 生成关联规则
4.3.3 挖掘有用知识
4.4 GAPI算法挖掘实验结果分析
4.4.1 频繁项集挖掘结果分析
4.4.2 关联规则生成结果分析
4.5 本章总结
第五章 基于频繁模式树的算法进一步优化及实验
5.1 FP-Growth算法的频繁模式树架构分析
5.2 基于频繁模式树的一般化关联规则算法GFP算法
5.2.1 FP-Growth算法优化思路及GFP算法的提出
5.2.2 GFP算法有效性验证
5.2.3 GFP算法的JAVA实现
5.3 基于GFP算法的通信运营商数据挖掘实验
5.4 GFP算法挖掘实验结果分析
5.5 本章总结
第六章 总结与展望
6.1 论文总结
6.2 未来展望
参考文献
附录
致谢
攻读学位期间发表的学术论文
本文编号:3859694
本文链接:https://www.wllwen.com/guanlilunwen/sjfx/3859694.html