当前位置:主页 > 管理论文 > 统计学论文 >

微博会员流失预测

发布时间:2020-09-29 06:30
   随着互联网技术的高速发展,中国已经进入到互联网时代,各个互联网公司、企业已经积累了TB级甚至PB级的用户数据,这些数据作为互联网公司的巨大财富,加以利用,可以给公司有效节约成本、增加收入。因此如何挖掘出隐藏在数据中的某种规律,显得十分重要。数据挖掘技术是是通过数学模型方法对数据进行拟合,利用计算机技术去实现模型,最后反馈到业务实施建议上的技术。在客户流失预测方面,有很多数据挖掘的分类算法可以有用武之地。本文针对国内社交平台新浪微博的会员数据,利用数据挖掘中的分类预测算法,对会员流失进行预测。基于2015年4月2日至8日会员身份即将到期的26171位微博会员用户的数据,首先利用k-means聚类,选用用户属性和主动行为数据作为特征,对用户进行细分,找出了价值较高的用户群体。对于本文的不平衡样本集,对样本量较少的类别采用有放回重复抽样的方法。然后选用70%的样本作为训练集,利用逻辑回归、决策树C5.0、神经网络分类预测模型,对会员是否流失做出预测,其中逻辑回归在ROC曲线和提升图上均表现地比决策树C5.0要好。之后引入代价敏感学习,对于将流失用户预测为非流失会员用户加大了代价,改进决策树C5.0,预测出了流失用户名单,用于企业挽留措施的目标群体。
【学位单位】:北京理工大学
【学位级别】:硕士
【学位年份】:2017
【中图分类】:C81
【部分图文】:

曲线,曲线,因变量,连接函数


因变量一般是连续变量,那么当因变量是二?logistic 回归就是这样一个分类模型。性模型,一般不能应用于分类问题上,二分设函数表达式为 ( ) = 数。值也是在( )范围上的。那么怎么才能连接函数,称为 logistic 函数,因其函数图像tic 函数的表达式为: ( ) =

空值,数据质量,对相,短信


北京理工大学硕士学位论文续表 3.5变量名 变量类型 变量说明 变量取值累计使用特权种类 离散 累计使用特权的种类 0~4短信特别关注人数 连续 短信特别关注人数 0~18是否使用短信特别关注 连续 短信特别关注人数不为 0 为使用,1 为使用 0,13.3 数据清洗从业务部门获得的数据往往是一些脏数据,对于建模还需对离群值、缺失值、极值等等进行处理才能达到建模要求的数据质量和形式。对于 26171 个会员数据,先来看看数据质量如何,spss modeler 里添加数据审核,得到完整字段的比例为 76.36%,完整记录的比例为 68.95%。以三个标准差为离群值的话,有很多离群值和极值,且有很多缺失空值。

饼图,样本分布,饼图


图 3.2 样本分布饼图大部分样本均为流失会员用户,是一个不平衡样本,这样的样本在采用欠抽样或者过抽样来减少样本量差异对结果的影响。用户的其他变量,可按照连续变量和离散变量来分析。续性变量的探索性分析大部分的变量均属于连续型变量,如用户的发博数、转发数、评论可以先看一下这些会员的登陆情况,这样可以反映他们上微博的活更好的直观效果,30 天前的登陆天数每 5 天归为一个登陆区间,

【参考文献】

相关期刊论文 前5条

1 罗彬;邵培基;罗尽尧;刘独玉;夏国恩;;基于多分类器动态集成的电信客户流失预测[J];系统工程学报;2010年05期

2 肖进;贺昌政;;基于动态分类器集成的客户流失预测模型研究[J];预测;2010年05期

3 夏国恩;;基于核主成分分析特征提取的客户流失预测[J];计算机应用;2008年01期

4 应维云;覃正;赵宇;李兵;李秀;;SVM方法及其在客户流失预测中的应用研究[J];系统工程理论与实践;2007年07期

5 叶进,程泽凯,林士敏;基于贝叶斯网络的电信客户流失预测分析[J];计算机工程与应用;2005年14期

相关硕士学位论文 前5条

1 赵冬伟;基于数据挖掘的客户流失预测研究[D];湘潭大学;2012年

2 刘孝会;基于决策树算法的IT行业客户流失预测技术研究[D];江西理工大学;2011年

3 司学峰;基于数据挖掘的客户流失预测实证研究[D];北京工业大学;2009年

4 罗巧玲;面向客户流失预测的关联规则挖掘算法应用研究[D];河北工业大学;2007年

5 程程;商业银行高端个人客户流失预测[D];清华大学;2007年



本文编号:2829366

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2829366.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户daaca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com