当前位置:主页 > 科技论文 > 软件论文 >

基于数据挖掘的实体零售业销售额预测研究

发布时间:2021-01-18 06:09
  精准的销售额预测能够帮助企业管理者有效的制定经营规划,进而使经营策略和工作计划更加有效和准确,提高企业综合竞争力。当前国内外基于零售业销售额的预测研究,通常使用时间序列分析预测方法与机器学习建模预测方法。时间序列分析预测方法在预测中突出了时间因素的作用,没有将外界的影响因素考虑在内,所以当外界环境变化较大时,预测值往往会有较大的误差。机器学习建模预测方法分析的是影响预测的全部因素,预测方法灵活高效。但是单独的机器学习建模预测方法基于预先假设,这种假设具有局限性,导致单个模型无法包含数据中的全部信息,需要组合多种模型建立混合模型进行预测。本文的研究重点是基于现实销售数据建立混合模型,提高预测模型的预测精度与泛化能力。本文的研究对象是德国实体零售业巨头Rossmann公司的多家商店销售数据与商店信息数据,对这些数据进行探索性数据分析,分析各变量对商店销售额的影响并进行可视化呈现。针对数据集特点进行数据预处理,搭建特征工程,比较了线性回归、随机森林、支持向量机、XGBoost模型在销售额预测上的表现,初步发现XGBoost模型在数据集上的预测精度评价指标最优。为了进一步提高XGBoost模型... 

【文章来源】:广东工业大学广东省

【文章页数】:71 页

【学位级别】:硕士

【部分图文】:

基于数据挖掘的实体零售业销售额预测研究


研究流程图

流程图,数据挖掘,流程,孤立点


广东工业大学硕士学位论文ntegrated Moving Average Model,ARIMA)、指数平滑(Exponential Smoothing,ES)等。5.孤立点分析在数据集中同大部分数据特征不一样的数据被称为孤立点。在大多数的数据挖案例中,孤立点通常被当作异常值删除处理,但是对于一些特殊的案例,孤立点具有研究价值的,比如天气灾害的预测,疾病的检测等等。.1.2 数据挖掘的流程一般数据挖掘的流程如图 2.1 所示:

工作流程图,工作流程,原始数据,数据分析


为模型构建提供最优特征集。 探索性数据分析国数据科学家 J.W.Tukey 于上世纪中叶提出了一种新的数据分析方法,叫数据分析。它是一种在预先假定尽可能少的情况下,分析原始数据的方法法有画图,列表,特征计算等等,通过这些方法探究原始数据的分布情况律[27]。初始性数据分析不同的是,初始性数据分析关注的是原始数据能否达到假统计模型所需的要求,它的目的在于保证验证分析的可靠性。在此过程中数据进行填补,对异常数据进行舍弃,对不符合要求的数据进行转换,为确分析的目的。而探索性数据分析的目的不仅仅是为了保证数据质量,更从原始数据中得到数据的分布模式,并且提出新的假设。


本文编号:2984430

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2984430.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户656a5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com