当前位置:主页 > 经济论文 > 国际贸易论文 >

基于Xgboost方法的实体零售业销售额预测研究

发布时间:2017-04-05 17:02

  本文关键词:基于Xgboost方法的实体零售业销售额预测研究,,由笔耕文化传播整理发布。


【摘要】:可靠的销售额预测能够帮助商场管理者建立有效的员工日程安排,并帮助商场管理者发现影响客户和团队的重要因素,从而改进生产模式,提高商场的赢利能力。本论文以德国著名实体零售业Rossmanns公司1115家分店的日常销售数据及店铺信息数据为挖掘对象,采用探索性数据分析及可视化技术,使用Python和R语言编程实现,对比了Xgboost(Extreme Gradient Boosting)、随机森林、GLMNET(Lasso and Elastic-Net Regularized Generalized Linear Models)以及LM(Linear Model)、TSLM(Time Series Linear Model)模型在销售额预测上的性能,初步发现Xgboost方法在RMSPE(Root Mean Square Percentage Error)评价标准上取得较好的效果。为进一步提高Xgboost方法的销售额预测精度和泛化性能,论文结合特征工程,采用集成学习方法,利用GLMNET和Xgboost模型拟合残差,结合LM、TSLM在趋势和季节性预测的优点,建立Xgboost组合模型,并通过参数调优提高其性能。通过实验证明,得到的最终组合模型可提高销售额预测的精度和泛化能力。基于Xgboost的组合模型不仅适用于对德国零售业销售额的预测,还可以将此方法应用于国内零售实体业甚至电商平台的销售额预测,对于提高商店的运营模式、商品的价格、配货方式及针对性的精准销售具有重要的意义。
【关键词】:销售额预测 数据挖掘 机器学习 Xgboost 集成学习
【学位授予单位】:南昌大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F713.32;F274;TP301.6
【目录】:
  • 摘要3-4
  • ABSTRACT4-8
  • 第1章 引言8-15
  • 1.1 课题来源及内容8
  • 1.2 课题背景及其意义8-11
  • 1.3 研究现状11-12
  • 1.4 研究内容12-13
  • 1.5 可行性分析及创新点13-14
  • 1.6 全文组织结构14-15
  • 第2章 基础算法综述15-29
  • 2.1 Boosting Tree提升树算法推导15-21
  • 2.1.1 学习目标函数15-17
  • 2.1.2 梯度树提升(Gradient Tree Boosting)17-20
  • 2.1.3 Shrinkage和列二次采样20-21
  • 2.2 分割搜寻算法21-25
  • 2.2.1 精确贪心算法21
  • 2.2.2 近似算法21-22
  • 2.2.3 加权分位数略图22-23
  • 2.2.4 稀疏感知分割搜索23-25
  • 2.3 Xgboost系统设计与性能比较25-29
  • 2.3.1 并行学习的列块25
  • 2.3.2 缓存感知访问25-26
  • 2.3.3 核外计算26
  • 2.3.4 与传统的GBDT算法的区别26-29
  • 第3章 探索性数据分析与可视化29-57
  • 3.1 探索性数据分析29-32
  • 3.1.1 探索性数据分析的特点30-31
  • 3.1.2 探索性数据分析内容31
  • 3.1.3 探索性数据分析的考察方法31-32
  • 3.2 数据可视化32-34
  • 3.2.1 数据可视化的意义33
  • 3.2.2 数据挖掘与可视化技术33-34
  • 3.3 探索性数据分析及可视化实现34-57
  • 3.3.1 数据来源34-35
  • 3.3.2 分类特征描述35-37
  • 3.3.3 数据特征分析可视化37-57
  • 第4章 特征工程57-71
  • 4.1 特征提取58-63
  • 4.1.1 数据清洗58-59
  • 4.1.2 特征分类59-60
  • 4.1.3 特征的预处理60-63
  • 4.2 特征选择63-67
  • 4.3 特征构建67
  • 4.4 特征工程过程67-71
  • 第5章 模型优化与实验对比71-88
  • 5.1 实验描述71-73
  • 5.1.1 实验条件71
  • 5.1.2 评估标准71-73
  • 5.2 模型参数及优化73-82
  • 5.2.1 Xgboost的模型参数73-77
  • 5.2.2 偏置-方差的折衷77
  • 5.2.3 控制过拟合77-78
  • 5.2.4 处理不平衡数据78
  • 5.2.5 超参数设置78-80
  • 5.2.6 交叉验证及独热编码80-82
  • 5.3 模型优化与对比82-88
  • 第6章 结论与展望88-89
  • 6.1 结论88
  • 6.2 进一步工作的方向88-89
  • 致谢89-90
  • 参考文献90-92

【相似文献】

中国期刊全文数据库 前10条

1 袁汉宁;;双层多示例集成学习[J];武汉理工大学学报(信息与管理工程版);2011年05期

2 俞扬;周志华;;集成学习中完全随机学习策略研究[J];计算机工程;2006年17期

3 张沧生;崔丽娟;杨刚;倪志宏;;集成学习算法的比较研究[J];河北大学学报(自然科学版);2007年05期

4 陈凯;;基于聚类技术的集成学习差异性研究[J];南京工业职业技术学院学报;2008年04期

5 李凯;崔丽娟;;集成学习算法的差异性及性能比较[J];计算机工程;2008年06期

6 潘志松;燕继坤;;少数类的集成学习[J];南京航空航天大学学报;2009年04期

7 陈凯;马景义;;一种选择性SER-BagBoosting Trees集成学习研究[J];计算机科学;2009年09期

8 陈全;赵文辉;李洁;江雨燕;;选择性集成学习算法的研究[J];计算机技术与发展;2010年02期

9 张燕平;曹振田;赵姝;郑尧军;杜玲;窦蓉蓉;;一种新的决策树选择性集成学习方法[J];计算机工程与应用;2010年17期

10 饶峰;;核机器集成学习算法的误差分析[J];重庆文理学院学报(自然科学版);2010年04期

中国重要会议论文全文数据库 前4条

1 关菁华;刘大有;贾海洋;;自适应多分类器集成学习算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

2 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

3 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年

4 李烨;蔡云泽;许晓鸣;;基于支持向量机集成的故障诊断[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年

中国博士学位论文全文数据库 前10条

1 阿里木·赛买提(Alim.Samat);基于集成学习的全极化SAR图像分类研究[D];南京大学;2015年

2 王永明;集成回归问题若干关键技术研究[D];华东师范大学;2015年

3 常征;基于混合集成学习的眼部与四肢交互动作建模与识别[D];北京科技大学;2016年

4 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年

5 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年

6 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年

7 王清;集成学习中若干关键问题的研究[D];复旦大学;2011年

8 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年

9 侯勇;特征提取与集成学习算法的研究及应用[D];北京科技大学;2015年

10 李烨;基于支持向量机的集成学习研究[D];上海交通大学;2007年

中国硕士学位论文全文数据库 前10条

1 李震宇;基于集成学习的数字图像隐写定量分析[D];解放军信息工程大学;2014年

2 王希玲;基于选择性集成学习的网络入侵检测方法研究[D];青岛科技大学;2016年

3 陈范曙;基于信息整合的药物相关信息挖掘方法研究[D];华东师范大学;2016年

4 游攀利;基于集成SVM的文本分类方法研究[D];华中科技大学;2014年

5 高慧珍;基于集成学习方法的多元统计过程异常诊断的研究[D];南京理工大学;2016年

6 苏涛;基于梯度提升树的行为式验证码人机识别的研究[D];华中师范大学;2016年

7 阎秋静;基于集成学习的高光谱图像分类[D];黑龙江大学;2016年

8 陶杰;基于集成学习的短文本主客观分类研究[D];安徽工业大学;2016年

9 杨印卫;基于异态集成学习的刀具状态监测技术研究[D];天津大学;2014年

10 徐燕会;基于神经影像的进展型轻度认知功能障碍识别研究[D];安徽工业大学;2016年


  本文关键词:基于Xgboost方法的实体零售业销售额预测研究,由笔耕文化传播整理发布。



本文编号:287341

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/287341.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2067f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com