基于运营商大数据的预出境用户识别方法研究
发布时间:2021-03-19 13:52
随着经济全球化和国际化进程的加快,出境服务市场迎来良好的发展契机,同时业内竞争也日趋激烈。在激烈的市场竞争环境下,实现差异化竞争是出境服务企业提升自身竞争力的重要途径。作为出境服务市场的核心,预出境用户的准确识别,对于出境服务产品的精准投放、高效的出入境管理起到决策性作用。大数据和数据科学技术的发展,极大地推进了对行业特定用户的精确挖掘研究。综上,本论文从用户的移动终端信息交互数据着手,利用运营商大数据进行预出境用户的特征挖掘和识别算法设计,实现预出境用户的精确识别。本论文利用深度包检测技术和爬虫采集应用程序的数据包解析信息、出境服务电话信息、出境服务机构的基站位置信息,然后基于规则构建移动用户行为分析参考字段库,最后通过运营商大数据和参考字段库关联匹配,挖掘潜在目标用户并提取用户的时空行为特征和静态特征。本论文提出一种基于最大信息系数和对称不确定性的相关性度量标准,然后基于Fisher准则、度量标准和马尔科夫毯条件,提出一种基于Fisher分和近似马尔科夫毯的移动用户出境特征选择算法。本论文首先提出一种基于多层分类器特征融合的预出境用户识别方法,该方法首先利用贝叶斯优化算法寻找模型最...
【文章来源】:重庆邮电大学重庆市
【文章页数】:95 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数逻辑回归算法实现步骤如下:
重庆邮电大学硕士学位论文第5章实验设计与结果分析60图5.4所选特征数量与四种特征选择算法的分类性能关系图图5.5为OFS_FMB算法与随机森林、方差分析法、SVM-RFE、卡方检验法四种特征选择算法在模型达到最高AUC值时的所选特征数量以及F1值对比图。从图5.5可以看出,无论是所选特征的数量还是模型的分类准确率和F1值,本文所提出的OFS_FMB都算是较优,其它四种特征选择算法中,AUC值最高的是随机森林,达到了71.54%。OFS_FMB算法选择的11个特征,AUC值和F1值分别达到了71.86%和77.45%。相较于随机森林分别高出0.32个百分点和0.18个百分点,且所选特征数量减少22个,在保证模型的分类性能同时,又对数据进行了降维。图5.5OFS_FMB与其它特征选择算法的性能对比OFS_FMB随机森林SVM-RFE方差分析法卡方检验法特征数量(个)1133393633AUC值(%)71.8671.5471.4571.4671.24F1值(%)77.4577.2777.2277.2377.07113339363371.8671.5471.4571.4671.2477.4577.2777.2277.2377.070102030405060708090
【参考文献】:
期刊论文
[1]多特征融合的句子级译文质量估计方法[J]. 叶娜,王远远,蔡东风. 厦门大学学报(自然科学版). 2020(02)
[2]基于深浅特征融合的人脸识别[J]. 赵淑欢. 电子技术应用. 2020(02)
[3]基于多模型融合的人体行为识别模型[J]. 余万里,韦玉梅,李鲁群. 计算机工程与设计. 2019(10)
[4]基于多核学习特征融合的语音情感识别方法[J]. 王忠民,刘戈,宋辉. 计算机工程. 2019(08)
[5]融合序列后向选择与支持向量机的混合式特征选择算法[J]. 吴清寿,刘长勇,林丽惠. 计算机系统应用. 2019(07)
[6]基于Kmeans++聚类的朴素贝叶斯集成方法研究[J]. 钟熙,孙祥娥. 计算机科学. 2019(S1)
[7]基于最大相关信息系数的FCBF特征选择算法[J]. 张俐,袁玉宇,王枞. 北京邮电大学学报. 2018(04)
[8]线性回归和随机森林算法融合在餐饮客流量的预测[J]. 杨森彬. 软件工程. 2018(07)
[9]基于filter+wrapper模式的特征选择算法[J]. 周传华,柳智才,丁敬安,周家亿. 计算机应用研究. 2019(07)
[10]基于多分类器加权投票法的越南语组合歧义消歧[J]. 李佳,郭剑毅,刘艳超,余正涛,线岩团,阮氏青娥. 计算机科学. 2018(01)
硕士论文
[1]基于手机信令数据的旅游交通客流特征分析研究[D]. 项译.东南大学 2017
[2]基于移动信令数据的用户出行行为研究[D]. 李耀辉.重庆邮电大学 2017
[3]基于移动通信交往圈的家庭用户识别研究[D]. 陆菁.上海交通大学 2014
[4]基于贝叶斯网络的马尔可夫毯发现算法研究[D]. 何宪.电子科技大学 2012
本文编号:3089682
【文章来源】:重庆邮电大学重庆市
【文章页数】:95 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数逻辑回归算法实现步骤如下:
重庆邮电大学硕士学位论文第5章实验设计与结果分析60图5.4所选特征数量与四种特征选择算法的分类性能关系图图5.5为OFS_FMB算法与随机森林、方差分析法、SVM-RFE、卡方检验法四种特征选择算法在模型达到最高AUC值时的所选特征数量以及F1值对比图。从图5.5可以看出,无论是所选特征的数量还是模型的分类准确率和F1值,本文所提出的OFS_FMB都算是较优,其它四种特征选择算法中,AUC值最高的是随机森林,达到了71.54%。OFS_FMB算法选择的11个特征,AUC值和F1值分别达到了71.86%和77.45%。相较于随机森林分别高出0.32个百分点和0.18个百分点,且所选特征数量减少22个,在保证模型的分类性能同时,又对数据进行了降维。图5.5OFS_FMB与其它特征选择算法的性能对比OFS_FMB随机森林SVM-RFE方差分析法卡方检验法特征数量(个)1133393633AUC值(%)71.8671.5471.4571.4671.24F1值(%)77.4577.2777.2277.2377.07113339363371.8671.5471.4571.4671.2477.4577.2777.2277.2377.070102030405060708090
【参考文献】:
期刊论文
[1]多特征融合的句子级译文质量估计方法[J]. 叶娜,王远远,蔡东风. 厦门大学学报(自然科学版). 2020(02)
[2]基于深浅特征融合的人脸识别[J]. 赵淑欢. 电子技术应用. 2020(02)
[3]基于多模型融合的人体行为识别模型[J]. 余万里,韦玉梅,李鲁群. 计算机工程与设计. 2019(10)
[4]基于多核学习特征融合的语音情感识别方法[J]. 王忠民,刘戈,宋辉. 计算机工程. 2019(08)
[5]融合序列后向选择与支持向量机的混合式特征选择算法[J]. 吴清寿,刘长勇,林丽惠. 计算机系统应用. 2019(07)
[6]基于Kmeans++聚类的朴素贝叶斯集成方法研究[J]. 钟熙,孙祥娥. 计算机科学. 2019(S1)
[7]基于最大相关信息系数的FCBF特征选择算法[J]. 张俐,袁玉宇,王枞. 北京邮电大学学报. 2018(04)
[8]线性回归和随机森林算法融合在餐饮客流量的预测[J]. 杨森彬. 软件工程. 2018(07)
[9]基于filter+wrapper模式的特征选择算法[J]. 周传华,柳智才,丁敬安,周家亿. 计算机应用研究. 2019(07)
[10]基于多分类器加权投票法的越南语组合歧义消歧[J]. 李佳,郭剑毅,刘艳超,余正涛,线岩团,阮氏青娥. 计算机科学. 2018(01)
硕士论文
[1]基于手机信令数据的旅游交通客流特征分析研究[D]. 项译.东南大学 2017
[2]基于移动信令数据的用户出行行为研究[D]. 李耀辉.重庆邮电大学 2017
[3]基于移动通信交往圈的家庭用户识别研究[D]. 陆菁.上海交通大学 2014
[4]基于贝叶斯网络的马尔可夫毯发现算法研究[D]. 何宪.电子科技大学 2012
本文编号:3089682
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3089682.html
最近更新
教材专著