融合多源数据的航班客座率预测方法研究
发布时间:2020-06-10 06:23
【摘要】:航空客运需求预测始终受到航空公司、机票代理商、飞机制造商等民航相关企业的关注。航班客座率是航空客运市场中用以衡量航班客运量需求的重要指标之一。准确地预测航班客座率将有利于航空公司处理航班机票超售、座位虚耗等问题,帮助民航从业者提前感知市场需求进而提高企业收益管理水平、为各级运营部门提供决策支持。传统的时间序列预测方法作为航班客座率预测问题的主流研究方法,以定义的某个航班作为研究对象,仅关注目标航班近期每日客座率的变化特点,无法同时考虑到该问题受到的其他众多因素的影响,因此无法获得理想的预测效果。除航班自身每日客座率变化外,目标航班客座率还受其所在航线中其他邻近起飞时刻的航班客座率影响,存在起飞时刻相关性,即同一航线上起飞时刻越相近的航班对应的客座率相差更小;在时间粒度上,航班客座率不仅存在起飞时刻相关性,还存在起飞日相关性,即航班自身的客座率数据在起飞日的时间维度上呈现出时间依赖关系,如航班待预测时间区间的客座率与该航班前一周同一星期的客座率具有的周周期性、与该航班去年同一时间区间的客座率具有的年周期性;同样,航班自身属性及节假日、航班所在航线是否开设高铁等其他因素也会影响航班客座率。为综合考虑以上因素进行准确的航班客座率预测,本文提出了一种新颖的基于多粒度时间注意力机制的循环神经网络模型(Multi-Granularity Time Attention Recurrent Neural Network,MTA-RNN),该模型构建多级注意力机制获取航班客座率在不同时间粒度下的时序相关性。本模型根据不同性质的时间依赖分别选取预测航班所在航线所有航班数据的临近时间区间及遥远时间区间数据,对两部分数据分别采用编码器进行编码。在编码器中,模型首先采用LSTM单元捕获预测航班所在航线中不同起飞时刻的航班客座率时间序列的时序依赖性,之后引入起飞时刻注意力机制,通过参考编码器上方LSTM单元之前起飞日的隐藏层状态,在每个起飞日自适应地提取编码器下方LSTM单元相关起飞时刻的隐藏层状态值。在解码器中,各部分编码器均引入起飞日注意力机制在所有的起飞日中选择相关编码器上方LSTM单元的隐藏层状态,并结合航班自身属性及节假日等其他因素,最终得到未来一段时间的目标航班经济舱客座率。本文在真实的历史航班客座率数据集上进行了实验,实验结果表明MTA-RNN模型相比传统的时间序列预测方法及最新的基于深度学习的预测方法具有明显的性能优势。
【图文】:
深层神经网络(Deep邋Neural邋Networks,邋DNNs)是指包含多个隐藏层的神经网络。逡逑无论每层每个神经元是线性的或非线性的,较低层运算单元的输出始终作为下一逡逑层运算单元的输入。图2-1展示了一个典型的深层神经网络的结构,其由输入层、逡逑输出层及中间的若干隐藏层组成。除了输出层,每一层都包含多个典型的神经元单逡逑元和一个固定偏执项。在实际使用过程中,输入层的维度和训练样本的维度保持一逡逑致并接受样本的矢量输入表示,隐藏层用于逐层提取输入样本的有效特征表示,输逡逑出层输出预测目标值。逡逑输逦输逡逑^邋_邋1逡逑图2-〗一个典型的深度神经网络结构逡逑Figure邋2-1邋A邋typical邋deep邋neural邋architecture逡逑11逡逑
邋BPTT)#%行训练,由于BPTT算法遵循共享参数等假设,使得模型在训练逡逑时容易出现梯度消失等问题,导致无法处理时间序列中的长期依赖关系。为解决这逡逑个问题,相关学者提出了长短期记忆网络,LSTM单元如图2-3所示,其中增加的逡逑3个门控单元让信息有选择性地影响循环神经网络中每个时刻的状态,记忆单元逡逑(Memory邋Cell)用来保存当前的网络状态。在形式上,LSTM可以表述如下:逡逑i<t>邋=逦+邋bd逦(2-12)逡逑/<f>邋=逦;》:0]逦+邋b,)逦(2-13)逡逑c<c>邋=邋tanh(Wc[a<i-1>;邋x<f>]邋+邋bc)逦(2-14)逡逑c<f>邋=邋fKt>邋*邋c<i_1>邋+邋i<l>逦*邋c<l>逦(2-15)逡逑00邋=逦[aC-1〉;无<2:>]逦+邋b0)逦(2-16)逡逑a<f>邋=邋0<z>邋*邋tanh(c<£>)逦(2-17)逡逑其中,W,表不权重矩阵,b,为偏置向量,*是哈达马乘积(HadamardProduct),,邋LSTM逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:V354;TP18
本文编号:2705907
【图文】:
深层神经网络(Deep邋Neural邋Networks,邋DNNs)是指包含多个隐藏层的神经网络。逡逑无论每层每个神经元是线性的或非线性的,较低层运算单元的输出始终作为下一逡逑层运算单元的输入。图2-1展示了一个典型的深层神经网络的结构,其由输入层、逡逑输出层及中间的若干隐藏层组成。除了输出层,每一层都包含多个典型的神经元单逡逑元和一个固定偏执项。在实际使用过程中,输入层的维度和训练样本的维度保持一逡逑致并接受样本的矢量输入表示,隐藏层用于逐层提取输入样本的有效特征表示,输逡逑出层输出预测目标值。逡逑输逦输逡逑^邋_邋1逡逑图2-〗一个典型的深度神经网络结构逡逑Figure邋2-1邋A邋typical邋deep邋neural邋architecture逡逑11逡逑
邋BPTT)#%行训练,由于BPTT算法遵循共享参数等假设,使得模型在训练逡逑时容易出现梯度消失等问题,导致无法处理时间序列中的长期依赖关系。为解决这逡逑个问题,相关学者提出了长短期记忆网络,LSTM单元如图2-3所示,其中增加的逡逑3个门控单元让信息有选择性地影响循环神经网络中每个时刻的状态,记忆单元逡逑(Memory邋Cell)用来保存当前的网络状态。在形式上,LSTM可以表述如下:逡逑i<t>邋=逦+邋bd逦(2-12)逡逑/<f>邋=逦;》:0]逦+邋b,)逦(2-13)逡逑c<c>邋=邋tanh(Wc[a<i-1>;邋x<f>]邋+邋bc)逦(2-14)逡逑c<f>邋=邋fKt>邋*邋c<i_1>邋+邋i<l>逦*邋c<l>逦(2-15)逡逑00邋=逦[aC-1〉;无<2:>]逦+邋b0)逦(2-16)逡逑a<f>邋=邋0<z>邋*邋tanh(c<£>)逦(2-17)逡逑其中,W,表不权重矩阵,b,为偏置向量,*是哈达马乘积(HadamardProduct),,邋LSTM逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:V354;TP18
【参考文献】
相关期刊论文 前2条
1 原继东;王志海;;时间序列的表示与分类算法综述[J];计算机科学;2015年03期
2 张伟;;客座率浅析[J];民用飞机设计与研究;2012年S1期
本文编号:2705907
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/2705907.html