基于数据挖掘的潜在用户行为分析
发布时间:2020-09-19 20:27
随着我国通信行业的不断发展,一直以来,移动、联通、电信三家运营商用尽一切手段争夺现有市场的用户资源,竞争相当激烈。随着互联网的迅速发展,海量用户通信信息、流量消费信息、业务消费信息等行为数据变得可得,这为数据挖掘技术的展开提供了更广阔的平台,哪个运营商能够更快、更准确、更有效地获取用户需求,哪个运营商就能赢得商机,就能在市场中处于优势地位。基于消费者行为数据的挖掘有助于运营商更好地开展精准营销、客户流失预警、潜在客户识别和黑名单用户识别等业务,从而提高客户满意度,加强运营商的竞争力,从而制定针对性的营销策略实现企业的精确营销,为不同的用户需求制定个性化方案提供依据,最终实现节约用户营销成本、提升企业利润的目的。但客户的行为数据挖掘面临如数据量巨大、数据类型多样等问题的困扰,传统的数据挖掘手段很难取得满意的效果。本文根据运行商用户消费行为特点,对联通大王卡业务的实证数据进行了数据预处理、描述性分析,主成分分析优化特征工程,并采用方差分析进行特征选取,再使用随机森林和Xgboost算法来训练用户数据,并确定模型的优化方案,进行了参数优化,最终对两种算法的模型表现进行了评价与对比,发现Xgboost算法的分类效果更好,最后对Xgboost算法的结果进行了分析展示。
【学位单位】:东南大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:C81
【部分图文】:
第五章实例数据分析过程逡逑§5.2.2单变量特征分析逡逑绘制年龄的核密度图5.3,从核密度图可以更清晰地看出,年龄在10至24之间的人群更逡逑倾\乎办理王卡业务(1代表办理王卡业务,0代表非办理王,卡业务)。逡逑lM逦年龄的赛密度图逡逑A;逦逦邋0逡逑/\逦|逦!邋I逡逑ft邋05逦;逦1——1-\逦t逦逦逦!逦!逦逡逑n邋\逡逑11邋\/\逡逑ft邋00邋逦逦逡逑o逦io逦so逦an逦■?逦aa逦eo逡逑年龄逡逑图5.3:年龄分布的核密度ffl逡逑绘制当月腾讯APP使用次数的核密度图5.4,办理芏卡业务的人群3月腾讯克?^使用逡逑次数是普遍偏高于非办理S卡业务的人群的。逡逑绘制前三月平均OPfiS总流鸶的核密度图5.5,可以看出,办理王卡业务的人群前三个逡逑月的平均GPi?S总瑰_普遍偏高于非办理王卡业务的人群。逡逑§5.2.3特征相关性的可视化逡逑对筛选出的20个意要特征进行分析,绘制两两相关系数的热度图5.6,该图中小方格逡逑的颜色深浅表示相关系数的大小,颜色越浅表示对应的两个特征间的相关性越强。逡逑分别绘制前三月平均GPES总浠量和前兰p喉本牵校椋浚蛹品炎芰髁康南喙毓叵涤胩阱义涎妒悠凳褂昧鞲偷痹绿谘叮粒校桌粲昧髁肯喙毓叵档纳⒌隳穑罚约敖雀鲈缕骄簦鳎椋礤义现岛停嘲伲幔颍校恐档南喙毓叵涤胪ㄐ爬嗪臀⑿攀褂昧髁康南喙毓叵档纳⒌阃迹担福梢钥闯鼍咤义嫌幸欢ǖ南咝怨叵
本文编号:2822955
【学位单位】:东南大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:C81
【部分图文】:
第五章实例数据分析过程逡逑§5.2.2单变量特征分析逡逑绘制年龄的核密度图5.3,从核密度图可以更清晰地看出,年龄在10至24之间的人群更逡逑倾\乎办理王卡业务(1代表办理王卡业务,0代表非办理王,卡业务)。逡逑lM逦年龄的赛密度图逡逑A;逦逦邋0逡逑/\逦|逦!邋I逡逑ft邋05逦;逦1——1-\逦t逦逦逦!逦!逦逡逑n邋\逡逑11邋\/\逡逑ft邋00邋逦逦逡逑o逦io逦so逦an逦■?逦aa逦eo逡逑年龄逡逑图5.3:年龄分布的核密度ffl逡逑绘制当月腾讯APP使用次数的核密度图5.4,办理芏卡业务的人群3月腾讯克?^使用逡逑次数是普遍偏高于非办理S卡业务的人群的。逡逑绘制前三月平均OPfiS总流鸶的核密度图5.5,可以看出,办理王卡业务的人群前三个逡逑月的平均GPi?S总瑰_普遍偏高于非办理王卡业务的人群。逡逑§5.2.3特征相关性的可视化逡逑对筛选出的20个意要特征进行分析,绘制两两相关系数的热度图5.6,该图中小方格逡逑的颜色深浅表示相关系数的大小,颜色越浅表示对应的两个特征间的相关性越强。逡逑分别绘制前三月平均GPES总浠量和前兰p喉本牵校椋浚蛹品炎芰髁康南喙毓叵涤胩阱义涎妒悠凳褂昧鞲偷痹绿谘叮粒校桌粲昧髁肯喙毓叵档纳⒌隳穑罚约敖雀鲈缕骄簦鳎椋礤义现岛停嘲伲幔颍校恐档南喙毓叵涤胪ㄐ爬嗪臀⑿攀褂昧髁康南喙毓叵档纳⒌阃迹担福梢钥闯鼍咤义嫌幸欢ǖ南咝怨叵
本文编号:2822955
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/2822955.html