移动互联网用户行为与换机预测技术的研究与开发
发布时间:2020-11-12 18:00
随着通信网络的高速发展和智能移动终端的广泛普及,移动互联网也迅速发展,为人们的生活提供了诸多便利,同时也为运营商和相关企业带来新的挑战和机遇。一方面,越来越多的用户通过移动终端访问互联网,网络数据量及业务类型激增,用户需求被淹没在移动互联网的海量资源中,如何从中挖掘用户行为特征及个性化需求是运营商和企业亟待解决的问题。另一方面,运用DPI业务识别技术和数据挖掘技术,深入分析用户偏好,预测潜在换机用户,成为运营商和企业提高市场竞争力、促进业务增长的重要突破口。基于此,本文对移动互联网用户行为分析与换机预测技术进行研发。本文主要工作如下:1.在深入研究信令解析、网络爬虫、DPI、数据分析与挖掘技术的基础上,设计了移动互联网用户行为与换机预测系统。该系统结合了层次化与模块化的设计思路,能降低耦合并提高性能,有较高的实用价值和现实意义。2.利用多线程主题网络爬虫获取互联网资源,并存入数据库中。结合爬虫信息库、基础特征库和匹配规则库,应用DPI技术实现对用户使用业务具体内容进行识别,识别准确率达到90%。3.在用户行为分析过程中,利用变异系数计算指标权重,再通过加权多指标评估法客观评估用户行为,深度挖掘用户偏好。4.在换机预测模型研究中,通过Logistic回归、神经网络、CHAID算法的对比,选取逻辑回归算法实现换机预测的开发,并对换机预测结果进行了验证,发现换机预测可以为精准营销提供依据,提升企业效益。本文实现系统能对海量用户数据进行业务识别,分析用户偏好,并预测潜在换机用户,为运营商、互联网服务提供商与手机制造商个性化精准营销提供支撑。
【学位单位】:重庆邮电大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F626;TP393.09;TN929.5
【部分图文】:
图 4.4 爬虫信息库实现结果--视频网站(截图)从图 4.4 中可以看到从视频网站抓取的信息,第一条数据可以看到 id 为lu657wp0v98un9p/a0022t6tsu3 的作品是“罗曼蒂克消亡史”,所属分类是电影,类型是内地、动作、悬疑、院线,视频所属区为内地,主演为葛优、章子怡等。
图 4.5 爬虫信息库实现结果-阅读网站(截图)从图 4.5 中可以看到从阅读网站抓取的具体信息,第一条数据可以看到 id 为64588 的作品是“都市至尊系统”,分类是都市生活,子类型是都市异能,作者为杯中窥香。
图 4.7 基础特征库部分特征(截图)(2) 读取解码解码结果,构建 DPIInfo。DPIInfo 类是业务识别的基础,是根解码出表文件构建的。该类包含了业务面出表文件的各个字段,具体有源 IP 地址目的 IP 地址、端口、Host、Refer 和 URL 等。(3) 根据 IP 三元组或五元组查找业务类型。如查找业务类型成功,则转入骤(5);查找失败,则转入步骤(4)。先根据 IP 五元组,即源 IP 地址、目的 IP 地址源端口、目的端口和承载协议类型查找业务类型;当通过 IP 五元组未能成功找时,再根据 IP 三元组即 IP 地址、端口号和协议类型查找业务类型。(4) 用基础特征库的各类特征匹配业务。把 DPIInfo 中的字段信息与基础特库中的特征要素进行匹配,识别移动互联网用户使用业务类型。由于特征库中的征种类较多,对特征进行一一匹配,需有匹配顺序。默认按照 Host、URI、ReferUser-Agent 和三层 IP 地址等特征要素顺序进行业务类型识别,如果先用于匹配
【参考文献】
本文编号:2881056
【学位单位】:重庆邮电大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F626;TP393.09;TN929.5
【部分图文】:
图 4.4 爬虫信息库实现结果--视频网站(截图)从图 4.4 中可以看到从视频网站抓取的信息,第一条数据可以看到 id 为lu657wp0v98un9p/a0022t6tsu3 的作品是“罗曼蒂克消亡史”,所属分类是电影,类型是内地、动作、悬疑、院线,视频所属区为内地,主演为葛优、章子怡等。
图 4.5 爬虫信息库实现结果-阅读网站(截图)从图 4.5 中可以看到从阅读网站抓取的具体信息,第一条数据可以看到 id 为64588 的作品是“都市至尊系统”,分类是都市生活,子类型是都市异能,作者为杯中窥香。
图 4.7 基础特征库部分特征(截图)(2) 读取解码解码结果,构建 DPIInfo。DPIInfo 类是业务识别的基础,是根解码出表文件构建的。该类包含了业务面出表文件的各个字段,具体有源 IP 地址目的 IP 地址、端口、Host、Refer 和 URL 等。(3) 根据 IP 三元组或五元组查找业务类型。如查找业务类型成功,则转入骤(5);查找失败,则转入步骤(4)。先根据 IP 五元组,即源 IP 地址、目的 IP 地址源端口、目的端口和承载协议类型查找业务类型;当通过 IP 五元组未能成功找时,再根据 IP 三元组即 IP 地址、端口号和协议类型查找业务类型。(4) 用基础特征库的各类特征匹配业务。把 DPIInfo 中的字段信息与基础特库中的特征要素进行匹配,识别移动互联网用户使用业务类型。由于特征库中的征种类较多,对特征进行一一匹配,需有匹配顺序。默认按照 Host、URI、ReferUser-Agent 和三层 IP 地址等特征要素顺序进行业务类型识别,如果先用于匹配
【参考文献】
相关期刊论文 前8条
1 宋竹;秦志光;罗嘉庆;张悦涵;;电信数据中用户行为特征测量与分析[J];电子科技大学学报;2015年06期
2 刘力凯;王国胤;邓维斌;;优势关系粗糙集的移动用户换机预测方法[J];小型微型计算机系统;2015年08期
3 熊冰妍;王国胤;邓维斌;;分级式代价敏感决策树及其在手机换机预测中的应用[J];山东大学学报(工学版);2015年05期
4 黄棣;;手机用户行为特征分析[J];微型机与应用;2015年14期
5 宋彦蓉;张宝元;;基于地区现代化评价的客观赋权法比较[J];统计与决策;2015年11期
6 于娟;刘强;;主题网络爬虫研究综述[J];计算机工程与科学;2015年02期
7 王建;张治中;骆云龙;;基于DPI的LTE网络用户行为感知系统的设计与实现[J];电信科学;2014年07期
8 李刚;程砚秋;董霖哲;王文君;;基尼系数客观赋权方法研究[J];管理评论;2014年01期
相关硕士学位论文 前2条
1 熊冰妍;不平衡数据分类方法及其在手机换机预测中的应用[D];重庆邮电大学;2016年
2 杨秀松;基于数据挖掘的电信潜在换机客户的预测研究[D];云南大学;2015年
本文编号:2881056
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/2881056.html