基于XGBoost和CatBoost相结合的消费券精准投放研究
发布时间:2021-02-06 13:26
O2O即Online to Offline,是一种线下商户与互联网相互结合的商业模式。近年来,随着移动端网络消费的兴起,O2O消费得到了各大商业平台的广泛关注,其中蕴藏着巨大的商业价值。消费券投放是O2O的一种重要营销策略,但随机投放会对大多数用户造成干扰,同时也会增加商家的营销成本。精准投放是提高消费券核销率的重要技术,它可以让商家直接面向具有一定消费偏好的用户,使其得到真正的实惠,在降低商家营销成本的同时促进商家的营业额,实现商家、用户共赢。O2O行业的特性使其天然与数以亿计的消费者相关联,记录着海量的用户历史流水信息。本文通过对这些真实的用户历史流水记录进行挖掘,并构建相应的特征群训练得到用户的消费券核销预测模型,以此预测用户未来是否会使用消费券,从而为消费券的精准投放提供决策依据,主要的研究工作可以分为以下四个方面:(1)首先从消费券、商户以及用户三个方面进行数据探索并在此基础上构建相应的特征群,用以表征用户的消费行为习惯,商户和消费券本身的信息属性,并通过方差选择和极端梯度提升树算法XGBoost对原始特征进行特征筛选,以去除相应的冗余特征,完成数据集的构建;(2)为了增强特...
【文章来源】:广东工业大学广东省
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
用户历史交互记录Fig.2-1Userhistoryinteractionrecord每条记录都含有7个字段,分别表示用户ID、商户ID、消费券ID、消费券的折扣
图 2-15 用户对同一类型消费券的重复领取记录Fig. 2-15 Repeated receiving records of the same type of consumer vouchers by users图2-15是用户对同一类型消费券重复领取记录的节选,各字段属性分别为用户ID、消费券 ID、消费券领取时间、距离以及用户消费时间。如果最后一个字段为 null,那么用户并没有消费,否则就为使用消费券消费。通过观察可以得知,如果对同一类型消费券进行重复领取,那么用户大概率会有核销消费券的行为。与商户有出售范围类似,用户也有相应的活动范围。通常情况下,用户基于远距离消费的一种重要原因就是该消费行为受商家促销活动的吸引,也即是说用户的活动范围越广泛,那么该用户消费券的核销几率也会相应的上升。2.3 特征选择在 2.2 节中
第四章 模型训练与结果分析型训练与结果对比通过上述参数设置训练得到基于 XGBoost 的消费券核销预测模型,DT 模型进行对比,两种模型的训练时间、AUC 值以及 ROC 曲线如表 4-3 XGBoost 与 GBDT 结果对比Tab. 4-3 Comparison of XGBoost and GBDT results模型 训练时间 AUCGBDT 5min20s 0.8149XGBoost 2min33s 0.8198
【参考文献】:
期刊论文
[1]基于深度学习的论文个性化推荐算法[J]. 王妍,唐杰. 中文信息学报. 2018(04)
[2]基于随机森林算法的推荐系统的设计与实现[J]. 沈晶磊,虞慧群,范贵生,郭健美. 计算机科学. 2017(11)
[3]基于深度学习加强的混合推荐方法[J]. 张敏,丁弼原,马为之,谭云志,刘奕群,马少平. 清华大学学报(自然科学版). 2017(10)
[4]XGBoost算法在电子商务商品推荐中的应用[J]. 张昊,纪宏超,张红宇. 物联网技术. 2017(02)
[5]基于SDAE及极限学习机模型的协同过滤应用研究[J]. 潘昊,王新伟. 计算机应用研究. 2017(08)
[6]利用交叉推荐模型解决用户冷启动问题[J]. 朱坤广,杨达,崔强,郝春亮. 计算机应用与软件. 2016(05)
[7]基于DNN算法的移动视频推荐策略[J]. 陈亮,汪景福,王娜,李霞. 计算机学报. 2016(08)
本文编号:3020690
【文章来源】:广东工业大学广东省
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
用户历史交互记录Fig.2-1Userhistoryinteractionrecord每条记录都含有7个字段,分别表示用户ID、商户ID、消费券ID、消费券的折扣
图 2-15 用户对同一类型消费券的重复领取记录Fig. 2-15 Repeated receiving records of the same type of consumer vouchers by users图2-15是用户对同一类型消费券重复领取记录的节选,各字段属性分别为用户ID、消费券 ID、消费券领取时间、距离以及用户消费时间。如果最后一个字段为 null,那么用户并没有消费,否则就为使用消费券消费。通过观察可以得知,如果对同一类型消费券进行重复领取,那么用户大概率会有核销消费券的行为。与商户有出售范围类似,用户也有相应的活动范围。通常情况下,用户基于远距离消费的一种重要原因就是该消费行为受商家促销活动的吸引,也即是说用户的活动范围越广泛,那么该用户消费券的核销几率也会相应的上升。2.3 特征选择在 2.2 节中
第四章 模型训练与结果分析型训练与结果对比通过上述参数设置训练得到基于 XGBoost 的消费券核销预测模型,DT 模型进行对比,两种模型的训练时间、AUC 值以及 ROC 曲线如表 4-3 XGBoost 与 GBDT 结果对比Tab. 4-3 Comparison of XGBoost and GBDT results模型 训练时间 AUCGBDT 5min20s 0.8149XGBoost 2min33s 0.8198
【参考文献】:
期刊论文
[1]基于深度学习的论文个性化推荐算法[J]. 王妍,唐杰. 中文信息学报. 2018(04)
[2]基于随机森林算法的推荐系统的设计与实现[J]. 沈晶磊,虞慧群,范贵生,郭健美. 计算机科学. 2017(11)
[3]基于深度学习加强的混合推荐方法[J]. 张敏,丁弼原,马为之,谭云志,刘奕群,马少平. 清华大学学报(自然科学版). 2017(10)
[4]XGBoost算法在电子商务商品推荐中的应用[J]. 张昊,纪宏超,张红宇. 物联网技术. 2017(02)
[5]基于SDAE及极限学习机模型的协同过滤应用研究[J]. 潘昊,王新伟. 计算机应用研究. 2017(08)
[6]利用交叉推荐模型解决用户冷启动问题[J]. 朱坤广,杨达,崔强,郝春亮. 计算机应用与软件. 2016(05)
[7]基于DNN算法的移动视频推荐策略[J]. 陈亮,汪景福,王娜,李霞. 计算机学报. 2016(08)
本文编号:3020690
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3020690.html