基于时序数据的音乐流媒体用户流失预测
发布时间:2021-08-08 01:16
随着互联网的快速发展,音乐流媒体市场正在不断扩大。各大音乐流媒体服务平台通过多样的方式吸引新用户,抢占市场份额。与此同时,平台老用户根据自身喜好更换平台几乎不需要任何成本,这对于音乐流媒体服务平台来说意味着老用户容易流失。用户流失会对企业利润产生很大的影响,所以准确识别出高流失倾向的用户并实施相应的挽留操作显得尤为重要。目前业界的主流做法是利用数据挖掘和机器学习技术来预测潜在的流失用户。针对音乐流媒体领域用户流失数据的特点以及目前用户流失预测方法存在的问题,本文从模型和特征两个层面来改善流失预测效果,具体的研究工作如下:(1)考虑到音乐流媒体领域的用户流失数据集通常包含大量的时序数据,而LSTM模型常被用来进行序列建模,本文提出一种基于集成LSTM的用户流失预测模型,旨在从模型集成的角度出发提升流失预测效果。该集成模型一方面采用LSTM模型作为基学习器;另一方面结合真实数据的特点改进Snapshot集成方法,在模型训练过程中引入样本权重调整机制,同时利用学习法结合子模型输出。实验结果表明,相比于原始LSTM模型,本文提出的模型在PR-AUC上提升4.21%。(2)由于目前用户流失预测任...
【文章来源】:苏州大学江苏省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图2-3?CNN结构图??
???????」丨??'???',??h样本U?I?时騰征?|?!?I??:特征?|?「-?r??处理;?Spark?〉Python?? ̄????、、L?:?L????J?j??f?:?;?r——「一fr…-二二?一:—i?)??HDFS??:数据?i?i??v???源?i?!?????日志数据??i?i?i?:?????i?i???!丨-???????J?J??图2-5用户流失预测框架??2.5?本章小结??本章首先介绍了决策树模型,并以CART为例给出决策树的学习步骤。其次介??绍了基于决策树的两种集成模型,随机森林和XGBoost。接着介绍了循环神经网络、??长短期记忆网络以及卷积神经网络的模型特点以及工作原理。然后介绍了集成学习的??概念以及集成学习中两种常用的输出结合策略。最后介绍了本文设计的用户流失预测??框架。??16??
Loshchilov等人提出一种余弦退火与热重启相结合的循环学习率策略,该策略在一??个学习率变化周期内使用余弦函数来降低学习率,在下一个周期开始时,将学习率重??置为初始值,并基于当前的模型参数继续训练,其变化形式如公式(3-1)所示。??a(t)?=?—?cos??^——^^?+1?(3-1)??l?rr/Mi?j?j??上式中,a。表示初始学习率,和原论文中学习率在每个batch训练结束时更新不同,??本文实验中学习率会在每个epoch训练结束时更新,(表示当前训练的epoch数,T表??示总epoch数,M表示学习率的更新周期数。图3-1是循环学习率的一个示例。?????
【参考文献】:
期刊论文
[1]电信客户流失的组合预测模型[J]. 余路. 华侨大学学报(自然科学版). 2016(05)
[2]在线游戏用户的流失预测:基于不平衡数据的采样方法比较和分析[J]. 吴悦昕,赵鑫,过岩巍,闫宏飞. 中文信息学报. 2016(04)
[3]基于社交网络的MMORPG玩家流失分析与预测[J]. 丁军,高大启,薛程元,陈小红. 计算机应用与软件. 2016(03)
[4]支持向量机模型在银行客户流失预测中的应用研究[J]. 贺本岚. 金融论坛. 2014(09)
本文编号:3328914
【文章来源】:苏州大学江苏省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图2-3?CNN结构图??
???????」丨??'???',??h样本U?I?时騰征?|?!?I??:特征?|?「-?r??处理;?Spark?〉Python?? ̄????、、L?:?L????J?j??f?:?;?r——「一fr…-二二?一:—i?)??HDFS??:数据?i?i??v???源?i?!?????日志数据??i?i?i?:?????i?i???!丨-???????J?J??图2-5用户流失预测框架??2.5?本章小结??本章首先介绍了决策树模型,并以CART为例给出决策树的学习步骤。其次介??绍了基于决策树的两种集成模型,随机森林和XGBoost。接着介绍了循环神经网络、??长短期记忆网络以及卷积神经网络的模型特点以及工作原理。然后介绍了集成学习的??概念以及集成学习中两种常用的输出结合策略。最后介绍了本文设计的用户流失预测??框架。??16??
Loshchilov等人提出一种余弦退火与热重启相结合的循环学习率策略,该策略在一??个学习率变化周期内使用余弦函数来降低学习率,在下一个周期开始时,将学习率重??置为初始值,并基于当前的模型参数继续训练,其变化形式如公式(3-1)所示。??a(t)?=?—?cos??^——^^?+1?(3-1)??l?rr/Mi?j?j??上式中,a。表示初始学习率,和原论文中学习率在每个batch训练结束时更新不同,??本文实验中学习率会在每个epoch训练结束时更新,(表示当前训练的epoch数,T表??示总epoch数,M表示学习率的更新周期数。图3-1是循环学习率的一个示例。?????
【参考文献】:
期刊论文
[1]电信客户流失的组合预测模型[J]. 余路. 华侨大学学报(自然科学版). 2016(05)
[2]在线游戏用户的流失预测:基于不平衡数据的采样方法比较和分析[J]. 吴悦昕,赵鑫,过岩巍,闫宏飞. 中文信息学报. 2016(04)
[3]基于社交网络的MMORPG玩家流失分析与预测[J]. 丁军,高大启,薛程元,陈小红. 计算机应用与软件. 2016(03)
[4]支持向量机模型在银行客户流失预测中的应用研究[J]. 贺本岚. 金融论坛. 2014(09)
本文编号:3328914
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3328914.html
最近更新
教材专著