基于改进CURE聚类的黑龙江移动公司用户数据挖掘研究
本文关键词:基于改进CURE聚类的黑龙江移动公司用户数据挖掘研究,由笔耕文化传播整理发布。
【摘要】:近年来随着云计算技术的发展以及移动终端设备的智能化,移动端的存储能力及计算能力得到提高,用户可以通过移动终端同时打开更多的应用程序,可以随时随地获取网络服务,因此越来越多的数据涌现出来,这些数据引起了研究人员及商业人士的广泛关注。电信运营商被称作是“数据金矿”的持有者,国内外的运营商都希望抓住大数据这一契机,将大数据有效利用。通信企业拥有的大数据以用户数据为主,如上网行为数据、网上交易数据、位置数据等,区别于以往的用户数据,这些数据多为非结构化数据,主要来源于互联网、移动互联网等,形成大数据量的数据源,因此如何更好地利用这些用户数据,如何选用合适的数据挖掘算法变得尤为重要。对用户数据进行挖掘,可以助力移动运营商为用户提供更好的个性化服务、降低用户离网率,带来新的增长点以及更多的业务机会,同时可以助力公司更好的应对大数据环境下的新挑战,避免沦为管道化经营,提高竞争优势。本文以黑龙江移动公司为研究对象(China Mobile Group Heilongjiang Company Limited,HLJ-CMCC),分析黑龙江省移动公司用户数据的类型、特点以及用户数据应用中存在的问题,进而分析用户数据挖掘的过程,将用户数据的挖掘过程分为用户数据获取与预处理、用户数据聚类与用户个性化管理三个阶段。在用户数据获取过程中,改进蚁群算法,完成云数据库传输路径优化;在用户数据聚类过程中改进CURE聚类算法,将用户分为高价值用户、潜在价值用户和低价值用户;最后将聚类结果与用户生命周期理论结合,进行用户个性化营销与用户挽留。通过对HLJ-CMCC用户数据挖掘及其应用的研究,一方面深化了数据挖掘的过程,融合大数据处理相关方法,完善了数据挖掘理论及方法;另一方面,帮助HLJ-CMCC合理的利用用户数据,充分挖掘用户数据,有效的进行业务处理,为HLJ-CMCC拓宽数据业务提供帮助。
【关键词】:黑龙江移动公司 用户数据挖掘 用户数据聚类 用户个性化管理
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F626
【目录】:
- 摘要5-6
- Abstract6-11
- 第1章 绪论11-19
- 1.1 研究背景11-12
- 1.2 研究目的及意义12
- 1.2.1 研究目的12
- 1.2.2 研究意义12
- 1.3 国内外研究现状及评述12-17
- 1.3.1 国外研究现状12-14
- 1.3.2 国内研究现状14-16
- 1.3.3 评述16-17
- 1.4 主要研究内容和方法17-19
- 1.4.1 研究内容17
- 1.4.2 研究方法17-18
- 1.4.3 技术路线18-19
- 第2章 HLJ-CMCC概况及用户数据挖掘过程分析19-28
- 2.1 HLJ-CMCC发展概况19-22
- 2.1.1 公司概况19
- 2.1.2 公司发展特点19-20
- 2.1.3 公司用户数据网络节点分布20-21
- 2.1.4 公司用户数据网络架构21-22
- 2.2 HLJ-CMCC用户数据特性分析22-24
- 2.2.1 用户数据内涵22-23
- 2.2.2 用户数据特点23
- 2.2.3 用户数据类型23-24
- 2.3 HLJ-CMCC用户数据应用问题分析24-25
- 2.4 HLJ-CMCC用户数据挖掘过程分析25-27
- 2.4.1 用户数据挖掘整体框架设计25-26
- 2.4.2 用户数据获取与预处理26-27
- 2.4.3 用户数据聚类27
- 2.4.4 用户个性化管理27
- 2.5 本章小结27-28
- 第3章 HLJ-CMCC用户数据获取与预处理28-39
- 3.1 HLJ-CMCC用户数据采集28-30
- 3.1.1 基于用户基本属性的用户数据采集28
- 3.1.2 基于用户相关费用的用户数据采集28-29
- 3.1.3 基于用户使用行为的用户数据采集29-30
- 3.2 基于改进蚁群算法HLJ-CMCC用户数据传输30-33
- 3.2.1 云数据库特点分析30-31
- 3.2.2 概率转移系数确定31-32
- 3.2.3 用户数据传输路径优化步骤32-33
- 3.3 HLJ-CMCC用户数据预处理33-38
- 3.3.1 HLJ-CMCC用户数据清洗34-35
- 3.3.2 HLJ-CMCC用户数据集成35-38
- 3.4 本章小结38-39
- 第4章 HLJ-CMCC用户数据聚类39-49
- 4.1 HLJ-CMCC用户数据聚类方法选择39-41
- 4.1.1 聚类方法对比分析39-40
- 4.1.2 改进聚类方法流程40-41
- 4.2 基于改进CURE算法的HLJ-CMCC用户数据聚类41-46
- 4.2.1 MapReduce函数构建41-42
- 4.2.2 基于区间数的移动用户数据距离表示42-44
- 4.2.3 基于改进CURE的移动用户数据聚类步骤44
- 4.2.4 HLJ-CMCC用户数据聚类运算44-46
- 4.3 基于用户数据聚类的用户类型确定46-48
- 4.3.1 高价值用户46-47
- 4.3.2 低价值用户47
- 4.3.3 潜在价值用户47-48
- 4.4 本章小结48-49
- 第5章 HLJ-CMCC用户个性化管理49-56
- 5.1 HLJ-CMCC用户生命周期分布49-50
- 5.2 面向高价值用户个性化管理50-51
- 5.2.1 高价值用户个性化营销50-51
- 5.2.2 高价值用户挽留51
- 5.3 面向潜在价值用户个性化管理51-53
- 5.3.1 潜在价值用户个性化营销51-53
- 5.3.2 潜在价值用户挽留53
- 5.4 面向低价值用户个性化管理53-55
- 5.4.1 低价值用户个性化营销53-54
- 5.4.2 低价值用户挽留54-55
- 5.5 本章小结55-56
- 结论56-57
- 参考文献57-62
- 攻读学位期间发表的学术论文62-63
- 致谢63
【相似文献】
中国期刊全文数据库 前10条
1 孙晓立;;大数据:让“云”落地成“雨”[J];中国科技投资;2012年Z2期
2 ;大数据[J];财务与会计(理财版);2013年07期
3 ;大数据的崛起:趋势、机遇与挑战[J];互联网周刊;2013年24期
4 谢然;;大数据引领智能交通 且行且珍惜[J];互联网周刊;2014年08期
5 陈飞;;大数据时代信息经济发展趋势及对策建议[J];宏观经济管理;2014年03期
6 ;大数据:福音还是祸源(上)[J];首席财务官;2014年04期
7 滕永昌;;大数据的商业价值[J];北京石油管理干部学院学报;2013年05期
8 杨敏;;浅谈大数据在银行的落地[J];中国金融电脑;2014年06期
9 刘博;;大数据时代旅游业的应对研究[J];旅游纵览(下半月);2013年06期
10 李瑞琴;郑建国;;大数据研究:现状、问题及趋势[J];现代商业;2013年36期
中国重要会议论文全文数据库 前4条
1 李田;郭利;冯鹏;;某型导弹单元设备自动检测系统软件设计[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
2 高世光;邓苏;王长缨;;关于ADO+引导数据种类的演变的研究[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
3 颜涯;邵佩英;;GIS与MIS系统集成技术在城市规划中的应用[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
4 谢国忠;;大数据时代下的企业管理与创新[A];创新驱动:新机遇 新挑战——2013年全国企业管理创新大会资料汇编[C];2013年
中国重要报纸全文数据库 前10条
1 中国科学技术发展战略研究院 许晔;大数据时代来袭 中国宜加紧布局[N];经济参考报;2013年
2 记者 李成成;崭露头角的大数据时代[N];企业家日报;2013年
3 ;精简企业数据是时候了[N];计算机世界;2008年
4 光大证券;“大数据”或成重要投资主线[N];中国证券报;2012年
5 本报记者 郭涛 李奕;与大数据打交道的那些人[N];中国计算机报;2012年
6 本报记者 齐洁;大数据蕴藏创业空间[N];中国经营报;2012年
7 吴勇毅;大数据“热”下的“冷”思考[N];中国冶金报;2012年
8 抚苏;众望所归,大数据时代来临[N];电脑报;2013年
9 《网络世界》记者 于翔;大数据的价值实现之旅[N];网络世界;2013年
10 本报记者 孙琦子;这些年,一起忽悠着的“大数据”[N];经济观察报;2013年
中国博士学位论文全文数据库 前5条
1 张兰廷;大数据的社会价值与战略选择[D];中共中央党校;2014年
2 李琦;基于多源数据的交通状态监测与预测方法研究[D];吉林大学;2013年
3 张新;区域性防灾减灾信息服务体系研究[D];中国科学院研究生院(遥感应用研究所);2006年
4 李智慧;基于可视化的三维放射治疗计算机模拟系统的研究[D];四川大学;2002年
5 袁培森;基于LSH的Web数据相似性查询研究[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 贾同;大数据对高等教育发展的推动研究[D];西南大学;2015年
2 张靖雯;基于GPS路网的重卡动力参数分析系统开发[D];长安大学;2015年
3 张辉;基于移动互联网的高速公路公众信息服务系统分析与研究[D];长安大学;2015年
4 邓先明;基于西安市矿产资源规划关系数据库的数据质量控制研究[D];长安大学;2015年
5 宣冬琦;上海银行的客户关系管理系统设计与实现[D];电子科技大学;2015年
6 王文佳;基于普适环境的FP-growth算法研究[D];中国石油大学(华东);2014年
7 汪文祥;考古遗址发掘数据分析研究与应用[D];浙江大学;2016年
8 杨太萌;基于大数据的城市防汛决策支持系统研究[D];浙江大学;2016年
9 魏麟钧;大数据与侦查方法论之创新[D];江西财经大学;2015年
10 陆鹏;基于Neo4j的大数据组织检索研究与应用[D];东南大学;2015年
本文关键词:基于改进CURE聚类的黑龙江移动公司用户数据挖掘研究,由笔耕文化传播整理发布。
,本文编号:252464
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/252464.html