基于网络访问项序的移动用户重入网识别方法
发布时间:2017-03-31 04:07
本文关键词:基于网络访问项序的移动用户重入网识别方法,由笔耕文化传播整理发布。
【摘要】:在任何的移动商务营销活动中,对于用户身份的唯一性标识都是不可或缺的基础工作。因为各种交叉因素的诸多影响,部分移动用户频繁的出入移动运营商网络已经成为普遍现象。伴随着用户的重新入网,那么针对该用户的旧号码的行为特征记录分析将完全失效,同时又需要重新对新号码的用户行为特征记录进行分析刻画,这样势必将耗费很长的时间才能重新获得该用户的完整行为刻画,对于运营商来说会造成极大的资源浪费和重复工作的不必要。所以对于重入网用户的身份识别有着很重要的意义和价值。目前对于移动用户重入网身份识别的研究主要是基于用户资料,IMEI码,呼叫指纹等进行识别。但是基于前两者的识别由于资料缺失、移动设备更换频繁等原因导致识别准确率较为低下,而基于呼叫指纹的识别方法的局限性较强,导致这些方法在实际生产操作中的可行性不大。在本文中,对于移动用户的重入网身份识别问题,从用户的上网行为特征出发,提出基于用户网络访问项序的用户相似性计算方法,根据“数据预处理→相似用户集挑选→基于个性化网站的相似用户集裁剪→基于时间特征的相似用户集裁剪→基于网站访问项序的相似用户集裁剪→基于网站访问频次的相似用户集裁剪→相同身份用户的识别”7个步骤对重入网用户身份进行精确的识别定位。最后,基于某通信运营商提供的某地区25809个用户60天网络访问日志数据集上,对本文所提方法的可行性与有效性进行了实验验证,结果显示总体准确率为96.64%,在可行性和有效性方面均有着很好的表现。
【关键词】:网络访问项序 重入网 身份识别 用户相似性计算
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.08
【目录】:
- 摘要4-5
- Abstract5-8
- 1 绪论8-18
- 1.1 课题背景及研究意义8-10
- 1.2 国内外研究现状10-15
- 1.2.1 基于用户资料的识别11-12
- 1.2.2 基于IMEI码的识别技术12-13
- 1.2.3 基于数据源的用户特征挖掘识别技术13-15
- 1.3 论文主要工作15-16
- 1.4 论文组织结构16-18
- 2 基于网络访问的重入网识别问题定义及解决思路18-29
- 2.1 问题模型定义18-19
- 2.2 解决思路19-28
- 2.2.1 上网日志数据源的分析19-21
- 2.2.2 基于数据挖掘启发式规则21
- 2.2.3 基于启发式规则设计算法21-28
- 2.3 本章小结28-29
- 3 基于用户网络访问项序的重入网用户身份识别算法29-41
- 3.1 数据预处理29-31
- 3.1.1 数据清理29-30
- 3.1.2 数据整理30-31
- 3.2 相似用户集挑选31-32
- 3.3 基于个性化网站的相似用户集裁剪32-33
- 3.4 基于时间特征的相似用户集裁剪33-35
- 3.4.1 基于用户整体上网时间的相似度比较33-34
- 3.4.2 基于用户针对具体网站的访问时间相似度比较34-35
- 3.5 基于网站访问项序的相似用户集裁剪35-37
- 3.5.1 利用PrefixSpan算法挖掘用户的习惯性网站访问序列36
- 3.5.2 利用LD算法计算习惯性网站访问序列相似度36-37
- 3.5.3 基于相似度进行裁剪37
- 3.6 基于网站访问频次的相似用户集裁剪37-38
- 3.7 相同身份用户的识别38-40
- 3.8 本章小结40-41
- 4 实验例证和结果分析41-53
- 4.1 实验环境41
- 4.2 实验思路41-50
- 4.2.1 数据集划分41-43
- 4.2.2 各阶段阈值的确定43-50
- 4.3 实验结果50-52
- 4.4 本章小结52-53
- 结论53-54
- 参考文献54-57
- 攻读硕士学位期间发表学术论文情况57-58
- 致谢58-59
【参考文献】
中国硕士学位论文全文数据库 前1条
1 章昱梓;移动用户重入网分析系统的分析与设计[D];北京邮电大学;2011年
本文关键词:基于网络访问项序的移动用户重入网识别方法,由笔耕文化传播整理发布。
,本文编号:278834
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/278834.html