面向机票业务的预测服务系统
发布时间:2020-05-12 07:02
【摘要】:随着航空工业的发展,航空公司的定价和仓位管理策略逐渐变得复杂,通过复杂的模型来使得公司收益最大化。在缺少相关公司定价策略和剩余仓位等关键信息的情况下,准确判断价格变动并在合适的时间点购买机票变得十分困难。在过去的研究中已有许多相关研究针对这一问题提出了一些方法,但这些方法大多简化了问题,将其构建成预测将来价格是否会下跌以及用户是否应该立刻购买的二分类问题,对于作为基础的具体价格预测少有文章提及其预测效果,而工业界出现的一些提供价格预测服务,不仅其预测算法难以获知,其预测效果也缺少对比实验数据,难以评判。而在少数直接针对具体价格预测的研究中,其效果仍有一定可以改良的空间。通过准确的预测价格变动可以有效的帮助用户判断购买机票的价格时间点,也可以帮助机票代理商正确决定机票及其相关产品的定价策略。因此如何准确预测机票价格变动具有重要的研究和实践意义。本文在上述背景下,针对机票价格预测及其相关预测服务系统的构建问题,提出相应的算法和完整的系统设计方案。本文的主要工作内容体现在一下方面:首先提出一种适用于机票价格预测的集成学习算法,机票价格变动通常是上下文相关的,且相关上下文特征在不同数据中变化,而一般回归预测算法或时间序列模型难以有效的将上下文信息包含到模型之中的问题,通过在集成模型中融入上下文信息,并通过自适应调整的方式,自动的发掘上下文特征,避免人工选择的主观性、低效性以及难以应对具有时变性的场景。通过不同的实验验证本算法针对机票预测这一应用场景的有效性以及算法中的各种改进与调整的必要性。针对数据量逐渐增大的场景,本文通过对上述预测算法的适当调整,提出了一种增量式的模型训练算法,通过让上下文特征增量式调整,并使用可增量式训练的基础模型,使得整个算法具备增量式学习的能力,从而降低随着数据的积累模型训练耗费时间不断增加的问题,并通过实验验证,其效果相较于批量式的训练模型并没有明显的下降。再在此基础上扩大应用场景,针对需要提供更加细粒度的预测场景,需要的预测任务量会变得十分巨大的问题,分析预测对象在短期内的变化特性,提出一种基于强化学习的通用的安排预测时间点的算法,通过只在合适的时间点预测来减少需要的预测量,同时将预测的准确度下降程度限制在合理的范围。通过实验验证算法能够确实减少预测任务量,同时保证预测的准确度。最后提出一种分布式预测系统,来提供完整的预测服务,本文将对此系统的各个模块的设计和实现进行详细介绍,同时针对系统中的预测任务分配问题,通过将问题进行适当简化抽象,转化为装箱问题,并给出一种近似算法来解决这一问题。
【图文】:
力[36],其预测过程如图2 1。图 2 1 集成学习器Fig 2 1 Ensemble Learning集成学习框架主要分成两个部分,一是构建差异化的学习器,二是如何将这些分类器的结果进行整合。差异化的学习器构建有三类方法:通过处理数据集生成差异化学习器、通过处理数据特征结构构建差异化分类器,通过分类器的处理构建差异化分类器。1. 通过处理数据集构建差异化学习器:这种方法一般是在原数据集上采用抽样技术获得多个不同的训练数据集,分别用于构建不同的学习器,常用的方法有bagging[37]和 boosting[38]。前者通过对原数据集进行有放回的采样构建出不同的数据集。后者是一个迭代过程,通过改变样本分布,对分类错误的样本增加权重,使得分类错误的样本在下一轮迭代的训练学习中发挥更大的作用。2. 通过处理数据特征构建差异化学习器:通过对原数据集的特征进行采样,形成不同的特征集,使用不同的特征集分别构建不同的学习器,这类算法中常用的即随机森林算法[39, 40]。3. 通过改变算法的参数等来产生不同的同质学习器
通过从环境中获取知识,改进行动方案,当某种行为获得了环境的正奖励后,便会加强这种行为的趋势,,最终目标是发现每个状态下使得期望的奖励和最大化的策略。一个强化学习系统,agent 与环境的交互过程可以表示成图2 2所示,强化学习采用一边获得样例一边学习的方式,在获取了最新的样例后会不断的更新模型,每次的动作都基于最新的模型采取可以获得最佳 reward 的动作。一个强化学习中涉及到探索— 10 —
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP301.6
本文编号:2659847
【图文】:
力[36],其预测过程如图2 1。图 2 1 集成学习器Fig 2 1 Ensemble Learning集成学习框架主要分成两个部分,一是构建差异化的学习器,二是如何将这些分类器的结果进行整合。差异化的学习器构建有三类方法:通过处理数据集生成差异化学习器、通过处理数据特征结构构建差异化分类器,通过分类器的处理构建差异化分类器。1. 通过处理数据集构建差异化学习器:这种方法一般是在原数据集上采用抽样技术获得多个不同的训练数据集,分别用于构建不同的学习器,常用的方法有bagging[37]和 boosting[38]。前者通过对原数据集进行有放回的采样构建出不同的数据集。后者是一个迭代过程,通过改变样本分布,对分类错误的样本增加权重,使得分类错误的样本在下一轮迭代的训练学习中发挥更大的作用。2. 通过处理数据特征构建差异化学习器:通过对原数据集的特征进行采样,形成不同的特征集,使用不同的特征集分别构建不同的学习器,这类算法中常用的即随机森林算法[39, 40]。3. 通过改变算法的参数等来产生不同的同质学习器
通过从环境中获取知识,改进行动方案,当某种行为获得了环境的正奖励后,便会加强这种行为的趋势,,最终目标是发现每个状态下使得期望的奖励和最大化的策略。一个强化学习系统,agent 与环境的交互过程可以表示成图2 2所示,强化学习采用一边获得样例一边学习的方式,在获取了最新的样例后会不断的更新模型,每次的动作都基于最新的模型采取可以获得最佳 reward 的动作。一个强化学习中涉及到探索— 10 —
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP301.6
【参考文献】
相关硕士学位论文 前3条
1 黄承真;云计算环境下机票价格预测及任务分配研究[D];中国科学技术大学;2014年
2 曹志杰;面向互联网机票数据抓取与票价预警系统的设计与实现[D];电子科技大学;2014年
3 陈岩松;机票票价预测系统设计与实现[D];大连理工大学;2013年
本文编号:2659847
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2659847.html