基于异源集成算法的用户购买行为预测研究
发布时间:2020-12-18 18:59
随着电子商务的飞速发展和互联网、物联网的普及,互联网用户信息量与日俱增。现阶段,我们已进入信息爆炸的大数据时代,“大数据”已成为现代社会的重要标志之一。电商大数据中用户对商品的操作行为可以体现用户偏好,如何从海量真实数据中挖掘出用户的潜在偏好成为学术界和工业界的研究重点,而且现今已取得众多的研究成果。在现有的用户购买行为预测问题的研究中,未全面考虑多类用户行为特征及不同行为间的关系,且集成算法的应用以同源集成为主。鉴于此,本文在真实数据集上,从五方面构建整体用户行为特征,综合考虑深度学习的表征学习能力和集成学习的训练效率,引入多层异源集成算法,将随机森林(Random Forest,RF)、LightGBM和XGBoost等多种算法进行组合,搭建了基于深度森林和Stacking学习法的多层算法框架,对用户复购行为和购买日期进行预测。本文主要工作如下:1.在用户购买预测基础预备方面,详细介绍了国内外研究现状及研究成果,对该领域应用广泛的算法模型进行描述,如传统机器学习算法:逻辑回归(Logistic Regression,LR)、支持向量机(Support Vector Machine,...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题研究背景
1.2 国内外研究现状
1.2.1 推荐算法的发展
1.2.2 购买行为预测研究现状
1.3 研究的目的及意义
1.4 研究内容与组织结构
第2章 机器学习算法理论基础
2.1 逻辑回归
2.2 支持向量机
2.3 随机森林
2.3.1 决策树理论基础
2.3.2 划分属性
2.3.3 随机森林构建过程
2.4 梯度提升决策树
2.4.1 GBDT算法原理
2.4.2 XGBoost & LightGBM提升
2.4.3 LightGBM优化
2.5 卷积神经网络
2.6 深度森林
2.7 Stacking技术
2.8 本章小结
第3章 基于时间滑窗的特征构建
3.1 数据介绍
3.1.1 数据来源
3.1.2 数据集变量描述
3.2 数据分析及特征提取
3.2.1 数据可视化描述
3.2.2 特征提取
3.3 数据处理
3.4 本章小结
第4章 基于深度森林的复购预测模型
4.1 模型搭建前的准备工作
4.1.1 模型评估指标
4.1.2 训练集和测试集构建
4.2 深度森林模型
4.2.1 多粒度扫描
4.2.2 级联森林
4.3 复购预测模型设计
4.3.1 深度森林模型介绍
4.3.2 模型选择及调参
4.3.3 深度森林算法描述
4.4 实验分析
4.4.1 实验环境
4.4.2 模型超参数设置
4.4.3 实验结果分析
4.5 本章小结
第5章 基于Stacking的日期预测模型
5.1 日期预测模型设计
5.1.1 Stacking结构介绍
5.1.2 模型选择
5.1.3 算法描述
5.2 实验设计
5.2.1 用户下单日期评价函数
5.2.2 实验对比
5.3 本章小节
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
攻读学位期间发表的学术成果和参加的科研项目
学位论文评阅及答辩情况表
【参考文献】:
期刊论文
[1]基于数据稀疏性的协同过滤推荐算法改进研究[J]. 岳希,唐聃,舒红平,安义文. 工程科学与技术. 2020(01)
[2]大数据个性化推荐分析[J]. 任敏. 物联网技术. 2019(11)
[3]基于XGBoost的三分类优惠券预测方法[J]. 张微薇,刘盾,贾修一. 南京航空航天大学学报. 2019(05)
[4]1997-2019:电商22周年发展历程及未来[J]. 苏鸣立. 计算机与网络. 2019(19)
[5]基于深度森林的用户购买行为预测模型[J]. 葛绍林,叶剑,何明祥. 计算机科学. 2019(09)
[6]基于Xgboost和LightGBM算法预测住房月租金的应用分析[J]. 谢勇,项薇,季孟忠,彭俊,黄益槐. 计算机应用与软件. 2019(09)
[7]基于深度LightGBM集成学习模型的谷歌商店顾客购买力预测[J]. 叶志宇,冯爱民,高航. 计算机应用. 2019(12)
[8]基于数据挖掘的风电功率预测特征选择方法[J]. 李俊卿,李秋佳,石天宇,郭晋才. 电测与仪表. 2019(10)
[9]基于用户隐式行为特征的最大熵推荐算法[J]. 胡敏,陈元会,黄宏程. 计算机工程与设计. 2019(02)
[10]Deep forest[J]. Zhi-Hua Zhou,Ji Feng. National Science Review. 2019(01)
硕士论文
[1]B2B电子商务平台系统的设计与研发[D]. 李丽君.山东大学 2019
[2]基于用户聚类和特征选择的在线购买行为预测研究[D]. 蔡一凡.华中科技大学 2019
[3]基于特征选择与改进stacking算法的股价预测研究[D]. 陈宇韶.南华大学 2018
[4]基于大数据的电子商务个性化信息推荐服务模式研究[D]. 胡一.吉林大学 2015
本文编号:2924442
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题研究背景
1.2 国内外研究现状
1.2.1 推荐算法的发展
1.2.2 购买行为预测研究现状
1.3 研究的目的及意义
1.4 研究内容与组织结构
第2章 机器学习算法理论基础
2.1 逻辑回归
2.2 支持向量机
2.3 随机森林
2.3.1 决策树理论基础
2.3.2 划分属性
2.3.3 随机森林构建过程
2.4 梯度提升决策树
2.4.1 GBDT算法原理
2.4.2 XGBoost & LightGBM提升
2.4.3 LightGBM优化
2.5 卷积神经网络
2.6 深度森林
2.7 Stacking技术
2.8 本章小结
第3章 基于时间滑窗的特征构建
3.1 数据介绍
3.1.1 数据来源
3.1.2 数据集变量描述
3.2 数据分析及特征提取
3.2.1 数据可视化描述
3.2.2 特征提取
3.3 数据处理
3.4 本章小结
第4章 基于深度森林的复购预测模型
4.1 模型搭建前的准备工作
4.1.1 模型评估指标
4.1.2 训练集和测试集构建
4.2 深度森林模型
4.2.1 多粒度扫描
4.2.2 级联森林
4.3 复购预测模型设计
4.3.1 深度森林模型介绍
4.3.2 模型选择及调参
4.3.3 深度森林算法描述
4.4 实验分析
4.4.1 实验环境
4.4.2 模型超参数设置
4.4.3 实验结果分析
4.5 本章小结
第5章 基于Stacking的日期预测模型
5.1 日期预测模型设计
5.1.1 Stacking结构介绍
5.1.2 模型选择
5.1.3 算法描述
5.2 实验设计
5.2.1 用户下单日期评价函数
5.2.2 实验对比
5.3 本章小节
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
攻读学位期间发表的学术成果和参加的科研项目
学位论文评阅及答辩情况表
【参考文献】:
期刊论文
[1]基于数据稀疏性的协同过滤推荐算法改进研究[J]. 岳希,唐聃,舒红平,安义文. 工程科学与技术. 2020(01)
[2]大数据个性化推荐分析[J]. 任敏. 物联网技术. 2019(11)
[3]基于XGBoost的三分类优惠券预测方法[J]. 张微薇,刘盾,贾修一. 南京航空航天大学学报. 2019(05)
[4]1997-2019:电商22周年发展历程及未来[J]. 苏鸣立. 计算机与网络. 2019(19)
[5]基于深度森林的用户购买行为预测模型[J]. 葛绍林,叶剑,何明祥. 计算机科学. 2019(09)
[6]基于Xgboost和LightGBM算法预测住房月租金的应用分析[J]. 谢勇,项薇,季孟忠,彭俊,黄益槐. 计算机应用与软件. 2019(09)
[7]基于深度LightGBM集成学习模型的谷歌商店顾客购买力预测[J]. 叶志宇,冯爱民,高航. 计算机应用. 2019(12)
[8]基于数据挖掘的风电功率预测特征选择方法[J]. 李俊卿,李秋佳,石天宇,郭晋才. 电测与仪表. 2019(10)
[9]基于用户隐式行为特征的最大熵推荐算法[J]. 胡敏,陈元会,黄宏程. 计算机工程与设计. 2019(02)
[10]Deep forest[J]. Zhi-Hua Zhou,Ji Feng. National Science Review. 2019(01)
硕士论文
[1]B2B电子商务平台系统的设计与研发[D]. 李丽君.山东大学 2019
[2]基于用户聚类和特征选择的在线购买行为预测研究[D]. 蔡一凡.华中科技大学 2019
[3]基于特征选择与改进stacking算法的股价预测研究[D]. 陈宇韶.南华大学 2018
[4]基于大数据的电子商务个性化信息推荐服务模式研究[D]. 胡一.吉林大学 2015
本文编号:2924442
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2924442.html