航班动态数据挖掘与航班预测模型的研究和实现
发布时间:2017-09-24 22:16
本文关键词:航班动态数据挖掘与航班预测模型的研究和实现
【摘要】:伴随着云计算时代的到来,越来越多的人们开始重视和关注大数据的研究。数据的来源或者承载的方式非常之多,大到物联网、云计算、移动互联网、车联网,小到手机、平板电脑、个人电脑,还包括分布在世界各个角落的各种类型的传感器。而大数据最核心的价值就是在于对海量的数据进行存储和分析。 科技水平的飞速发展,航班航线的快速增加,空中交通流量也随着日渐增长,由此产生了海量的航班历史运行数据,如何找到一些有效的数据处理的方法,使隐藏在这些数据中的丰富的知识和关联规则等进行有效地提取和分析,是一直困扰人们的难题。新兴的处理海量数据的技术——数据挖掘为解决这些问题提供了一种强有力的手段。 首先,本文通过数据挖掘的方式和方法,采用特征提取技术中主成分分析的方法,将航班动态的原始数据进行选择、预处理、转换、挖掘抽取、分析和同化,提取出机场的繁忙度、航班平均飞行时间、延误时间、起飞准点率、到达准点率,根据航空公司网站公布的舱位表,计算舱位的相对平均价格,根据每月实际乘坐航班的旅客最大数估计航班的总舱位数,按照南航2013年的航班上座人数,求得上座率,进而分析上座率与相对平均价格的关系、上座率与季节的关系。 其次,本文采用时间序列统计预测的方法,建立线性回归、非线性回归、人工神经网络、贝叶斯网络常均值模型,基于先验信息、总体分布信息、样本信息,推出后验分布信息的模式,根据航班的历史平均飞行时间数据,并且加入决策者的经验和判断等信息,对航班的到达时问进行估计。 最后,通过实验结果的分析,可以确认,采用数据挖掘的方法统计航班上座率与相对平均价格的相关性、上座率与季节的相关性,同时采用时间序列预测模型来预测航班的到达时间,对机票价格、航班计划时间的制定有一定的指导意义。
【关键词】:数据挖掘 特征提取 航班动态 时间序列
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;O211.61
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 绪论9-13
- 1.1 课题研究背景9-10
- 1.2 课题研究目的和意义10-11
- 1.3 课题研究现状11-12
- 1.4 课题研究内容及论文结构12-13
- 第二章 数据挖掘技术13-21
- 2.1 数据挖掘的涵义13-14
- 2.2 数据挖掘的过程14-15
- 2.2.1 确定业务对象14
- 2.2.2 数据准备14-15
- 2.2.3 数据挖掘15
- 2.2.4 结果分析15
- 2.2.5 知识同化15
- 2.3 数据挖掘的功能和算法15-17
- 2.4 数据挖掘的工具17-20
- 2.5 本章小结20-21
- 第三章 航班动态数据的挖掘与分析21-32
- 3.1 机场繁忙度22-26
- 3.1.1 机场当前10分钟起降次数23-24
- 3.1.2 机场当前10分钟起降延误次数24
- 3.1.3 机场历史1年平均起降次数24-25
- 3.1.4 机场历史1年平均起降延误次数25
- 3.1.5 机场繁忙度的计算25-26
- 3.2 航班准点率26-27
- 3.3 航班上座率及相对平均价格27-28
- 3.4 航班上座率与相对平均价格的关系28-29
- 3.5 航班上座率与季节的关系29-31
- 3.6 本章小结31-32
- 第四章 航班到达时间的预测算法研究32-45
- 4.1 航班到达时问的影响因素分析32-33
- 4.1.1 航班飞行时间32-33
- 4.1.2 航班经停延误时间33
- 4.2 航班飞行时间的研究33-39
- 4.2.1 航班飞行时间的直接计算方法34-36
- 4.2.2 航班飞行时间的间接计算方法36-37
- 4.2.3 计算航线飞行时间的正态分布区间37-38
- 4.2.4 计算航班的95%概率飞行时间38-39
- 4.3 航班经停延误时间的研究39-43
- 4.3.1 航班减速进港过程分析39-40
- 4.3.2 航班经停上下客过程分析40
- 4.3.3 航班加速离港过程分析40-41
- 4.3.4 航班经停延误模型41-43
- 4.4 航班到达时间预测模型43
- 4.5 本章小结43-45
- 第五章 航班到达时间预测模型的实现45-56
- 5.1 时间序列预测模型45-46
- 5.1.1 时间序列的定义45
- 5.1.2 时间序列预测模型的特点45-46
- 5.2 预测过程46-47
- 5.2.1 数据预处理46
- 5.2.2 预测步骤46-47
- 5.2.3 预测模型评估47
- 5.3 常见预测方法在航班到达时间中的应用47-55
- 5.3.1 线性回归方法48-49
- 5.3.2 非线性回归方法49-50
- 5.3.3 人工神经网络方法50-52
- 5.3.4 贝叶斯网络方法52-55
- 5.4 预测结果对比分析55
- 5.5 本章小结55-56
- 第六章 总结与展望56-58
- 6.1 论文工作总结56-57
- 6.2 问题与展望57-58
- 参考文献58-60
- 致谢60-61
- 攻读学位期间发表的学术论文61
【参考文献】
中国期刊全文数据库 前9条
1 吕林涛,李军怀,吕晖,宋昕,张杰;贝叶斯动态模型及其预测算法在数据挖掘中的应用研究[J];计算机工程与应用;2004年20期
2 曹卫东;贺国光;;连续航班延误与波及的贝叶斯网络分析[J];计算机应用;2009年02期
3 孙棣华;赖云波;廖孝勇;赵敏;刘卫宁;;公交浮动车辆到站时间实时预测模型[J];交通运输工程学报;2011年02期
4 田琳芳;王t$;;一种基于周期的动态贝叶斯网络预测模型[J];科技信息(学术研究);2008年08期
5 李炳燃;张金哲;;数据挖掘在设备故障诊断专家系统知识获取中的应用[J];科技信息;2011年20期
6 吉根林,帅克,孙志挥;数据挖掘技术及其应用[J];南京师大学报(自然科学版);2000年02期
7 马正平,崔德光;机场航班延误优化模型[J];清华大学学报(自然科学版);2004年04期
8 曹卫东;林翔宇;;基于贝叶斯网络的航班过站时间分析与延误预测[J];计算机工程与设计;2011年05期
9 朱世武 ,崔嵬 ,张尧庭 ,谢邦昌;数据挖掘运用的理论与技术[J];统计研究;2003年08期
中国博士学位论文全文数据库 前1条
1 刘玉洁;基于贝叶斯网络的航班延误与波及预测[D];天津大学;2009年
,本文编号:913772
本文链接:https://www.wllwen.com/kejilunwen/yysx/913772.html