基于组合模型的酒店线上销量预测的研究
发布时间:2020-06-03 22:34
【摘要】:随着移动互联网的飞速发展,运用手机等设备在网上订购酒店的方式日益受到了消费者的喜爱。如何利用订购平台上积累的海量数据对各酒店在未来一段时间的线上销量进行预测是平台进行收益管理与平台管理的核心。然而,酒店的线上销量数据通常受到复杂的市场因素的影响,具有波动复杂,节假日效应明显的特点。传统的单一时序模型难以精准捕捉到酒店销量波动特性,且移植性较差。针对上述问题,本文提出了一种基于组合模型的酒店线上销量预测算法。该算法由两个模型组成,即基于残差拟合的非节假日酒店线上销量预测模型与基于Lasso的节假日酒店线上销量预测模型。在预测前,算法首先判断待预测时间段属于什么时期,并采用对应的模型进行预测。对于基于残差拟合的非节假日酒店线上销量预测模型,本文针对非节假日时期的酒店线上销量数据具有强周期性以及随机性的特点,设计并实现了基于残差拟合模型组合方法对非节假日时期的酒店销量进行预测。该方法使用FBProphet模型与LightGBM模型来分别预测酒店销量的规律项与随机项,并将两个模型的结果进行了结合以得到最终的预测结果。对于基于Lasso的节假日酒店线上销量预测模型,本文针对节假日时期的酒店线上销量数据具有爆发性的特点,对日期与节假日的相对关系、提前预定量以及历史销量分位数与节假日时期的线上销量之间的相关性进行了分析。并基于这些分析设计了相应的特征工程与模型。此外,还提出了异常酒店的检测与修正方法对销量异常的酒店进行检测并进行预测值修正。所提算法通过对不同时间阶段的销量预测任务分别建模的方式解决了单模型在酒店线上销量预测场景中可移植性差的问题。同时,算法中还包含了异常酒店的检测与修正方法,缓解了模型难以对异常酒店预测出可靠结果的问题。本文采用国内某知名订购平台的真实销量数据为实验数据,通过一系列实验证明了本文算法在节假日时期与非节假日时期的Mae性能均优于LightGBM、FBProphet等单模型的性能。
【图文】:
于组合模型的酒店线上销量预测模型的算法框架。最后详细介绍了该算法框架中用到的两个主要算法的原理,即 FBProphet 算法与 LightGBM 算法的原理。2.1 酒店线上销量预测算法框架2.1.1 酒店线上销量数据分析与其他类型的电商产品的销量不同,,酒店的线上销量是酒店在某个时间段内,房间出租量的表示。目前,最常用的酒店销量计算单位为消费间夜量,它的计算方式为:间夜量=入住房间数*入住天数。本文对酒店线上销量的预测是以天为粒度的,即所要预测的是酒店在 OTA 平台上每天的实际消费间夜量。为了方便描述,定义本文中的销量、酒店销量、线上销量、消费间夜量等词互为同义词。酒店的消费间夜量数据是一类典型的时间序列数据。如图 2.1 所示,为国内某知名 OTA 平台上 500 家酒店在 2015 年 1 月 1 号至 2015 年 12 月 31 号一整年的总消费间夜序列图。
图 2.2 2015 年 11 月总销量序列图由于 2015 年 11 月 1 日到 2015 年 11 月 30 日不存在节假日也基本不受到响,因此选择该时段作为非节假日时期酒店销量数据的研究时段。图 2.2 所示为上文提到的 500 家酒店在此阶段线上总消费间夜量的时序图,由于国内五天工作日制度的影响,酒店的线上消费间夜量在非节假日时显的周期性,即周五周六的线上消费间夜量明显高于其他时间的线上消费上消费间夜量具有以七天为周期的重复性。除此之外,酒店的线上消费间其他多种因素(如价格、平台排名、竞争对手调价)的影响,这也造成了量序列中存在着趋势项与随机项。(2)节假日时期的酒店消费间夜量数据分析
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F719.2;F724.6
本文编号:2695498
【图文】:
于组合模型的酒店线上销量预测模型的算法框架。最后详细介绍了该算法框架中用到的两个主要算法的原理,即 FBProphet 算法与 LightGBM 算法的原理。2.1 酒店线上销量预测算法框架2.1.1 酒店线上销量数据分析与其他类型的电商产品的销量不同,,酒店的线上销量是酒店在某个时间段内,房间出租量的表示。目前,最常用的酒店销量计算单位为消费间夜量,它的计算方式为:间夜量=入住房间数*入住天数。本文对酒店线上销量的预测是以天为粒度的,即所要预测的是酒店在 OTA 平台上每天的实际消费间夜量。为了方便描述,定义本文中的销量、酒店销量、线上销量、消费间夜量等词互为同义词。酒店的消费间夜量数据是一类典型的时间序列数据。如图 2.1 所示,为国内某知名 OTA 平台上 500 家酒店在 2015 年 1 月 1 号至 2015 年 12 月 31 号一整年的总消费间夜序列图。
图 2.2 2015 年 11 月总销量序列图由于 2015 年 11 月 1 日到 2015 年 11 月 30 日不存在节假日也基本不受到响,因此选择该时段作为非节假日时期酒店销量数据的研究时段。图 2.2 所示为上文提到的 500 家酒店在此阶段线上总消费间夜量的时序图,由于国内五天工作日制度的影响,酒店的线上消费间夜量在非节假日时显的周期性,即周五周六的线上消费间夜量明显高于其他时间的线上消费上消费间夜量具有以七天为周期的重复性。除此之外,酒店的线上消费间其他多种因素(如价格、平台排名、竞争对手调价)的影响,这也造成了量序列中存在着趋势项与随机项。(2)节假日时期的酒店消费间夜量数据分析
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F719.2;F724.6
【参考文献】
相关期刊论文 前3条
1 赵学斌;李大学;谢名亮;;短生命周期产品的销量预测模型研究[J];计算机工程与设计;2010年11期
2 何永沛;;ARMA模型参数估计算法改进及在股票预测中的应用[J];重庆工学院学报(自然科学版);2009年02期
3 张录达,金泽宸,沈晓南,赵龙莲,李军会,严衍禄;SVM回归法在近红外光谱定量分析中的应用研究[J];光谱学与光谱分析;2005年09期
本文编号:2695498
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2695498.html