进港航班排序强化学习模型研究
本文选题:智能体 切入点:空中交通管制 出处:《工程科学与技术》2017年S2期 论文类型:期刊论文
【摘要】:为解决进港航班排序中智能化程度不高的现实问题,提出进港航班排序强化学习模型。首先,确定进港航班排序强化学习模型的状态、动作、智能体、环境、奖赏函数、约束条件、Q学习等。进港航班排序强化模型中的状态是各进港航班的到达时刻,动作是对航班到达时间的调整,智能体对航班的到达时刻进行调整,环境对动作做出反应,一个新的到达时间和奖赏值被传给智能体,奖赏函数考虑了延误时间、经济成本、对后续航班的影响。该模型考虑了航班不能提前降落,分配的到达时间不早于计划的到达时间,进港航班流量不能超过机场的到达容量值等约束条件。使用双流机场进港航班数据对该模型进行验证。对比分析先到先服务和强化学习模型的排序、延误时间、延误成本、后续航班延误成本和奖赏值。先到先服务算法的奖赏函数值为3 164,强化学习算法的奖赏函数值为2 880,强化学习模型更优。模型中奖惩函数的评价指标、权重、约束条件可以根据管制工作实际情况进行设置,该模型可以为空中交通管制人员进行进港航班排序提供决策支持。
[Abstract]:In order to solve the problems in real flight sequencing in the intelligent degree is not high, the inbound flights sort of reinforcement learning model. First, determine the inbound flights sort of reinforcement learning model of the state, action, agent, environment, reward function, constraint condition, Q learning. In class ranking model in strengthening port state is the entrance the arrival time of the flight, action is on flight arrival time adjustment agent on the flight arrival time is adjusted in response to environmental action, a new arrival time and the reward value is passed to the agent, the reward function considering the delay time, the economic cost, impact on the subsequent flights of the model. The flight cannot advance landing, distribution of the arrival time is not earlier than the planned arrival time, flight arrival flow cannot exceed the airport arrival capacity value as constraint conditions. The use of Shuangliu Airport inbound flight data To verify the model. A comparative analysis of first come first serve and the reinforcement learning model of sorting, delay time, delay cost, subsequent flight delay cost and reward value. First come first serve algorithm of the reward function value is 3164, a value of 2880 reward reinforcement learning algorithm, reinforcement learning model is better. The weights of evaluation indexes model, reward and punishment function, constraints can be set according to the actual situation of control, the model for air traffic control personnel arrival sequencing and scheduling decision support.
【作者单位】: 四川大学视觉合成图形图像技术国防重点学科实验室;
【基金】:国家空管委科研资助项目(GKG201403004)
【分类号】:TP181;V355
【参考文献】
相关期刊论文 前6条
1 王世豪;杨红雨;武喜萍;刘洪;;进港航班排序优化数学模型研究[J];四川大学学报(工程科学版);2015年06期
2 王世东;张越;张智海;鱼海洋;;繁忙机场航班降落排序的多目标优化[J];交通运输系统工程与信息;2012年04期
3 王飞;徐肖豪;张静;;终端区飞机排序的混合人工鱼群算法[J];交通运输工程学报;2008年03期
4 杨秋辉;游志胜;冯子亮;洪玫;;一种改进的基于遗传算法的多跑道到达飞机调度[J];四川大学学报(工程科学版);2006年02期
5 徐肖豪;李雄;;航班地面等待模型中的延误成本分析与仿真[J];南京航空航天大学学报;2006年01期
6 徐肖豪,黄宝军;终端区飞机排序的模糊综合评判方法研究[J];航空学报;2001年03期
【共引文献】
相关期刊论文 前10条
1 武喜萍;杨红雨;杨波;;进港航班排序强化学习模型研究[J];工程科学与技术;2017年S2期
2 王媛;胡明华;徐冬慧;;机场场面运行延误特性研究[J];武汉理工大学学报(交通科学与工程版);2017年03期
3 唐志星;朱新平;夏正洪;;A-SMGCS航空器滑行时间延迟的滑行路由实时更新算法[J];科学技术与工程;2017年16期
4 罗小林;;基于进离场容量转化的航班延误优化研究[J];西安航空学院学报;2017年03期
5 王世豪;杨红雨;李玉贞;韩松臣;杨波;;基于精英存档自适应微分进化算法的多跑道独立进近排序[J];工程科学与技术;2017年03期
6 曾奇;;基于补偿机制的航班时刻优化模型[J];江苏航空;2017年02期
7 王俊义;王兴隆;;近距平行跑道航班着陆调度研究[J];航空计算技术;2017年01期
8 夏正洪;;民航机场桥载设备投资回收期计算模型[J];中国科技论文;2016年19期
9 张书琴;姜雨;夏洪山;刘照明;;基于遗传模拟退火算法的航班进离场调度[J];航空计算技术;2016年05期
10 张维杰;龙华;胡婷;邵玉斌;;改进的遗传算法在延误飞机进场排序中的应用[J];信息技术;2016年07期
【二级参考文献】
相关期刊论文 前10条
1 沈济南;梁芳;郑明辉;;一种新的混合差分粒子群优化算法及其应用[J];四川大学学报(工程科学版);2014年06期
2 孙宏;张翔;徐杰;;应用模拟退火算法求解飞机调度问题[J];飞行力学;2006年04期
3 李志荣;张兆宁;;基于蚁群算法的航班着陆排序[J];交通运输工程与信息学报;2006年02期
4 杨秋辉;游志胜;冯子亮;洪玫;;一种改进的基于遗传算法的多跑道到达飞机调度[J];四川大学学报(工程科学版);2006年02期
5 徐肖豪;李雄;;航班地面等待模型中的延误成本分析与仿真[J];南京航空航天大学学报;2006年01期
6 李晓磊,路飞,田国会,钱积新;组合优化问题的人工鱼群算法应用[J];山东大学学报(工学版);2004年05期
7 徐肖豪,姚源;遗传算法在终端区飞机排序中的应用[J];交通运输工程学报;2004年03期
8 李晓磊,薛云灿,路飞,田国会;基于人工鱼群算法的参数估计方法[J];山东大学学报(工学版);2004年03期
9 张静;2002年世界前100家航空公司经营状况[J];中国民用航空;2004年01期
10 高鹰,谢胜利;基于模拟退火的粒子群优化算法[J];计算机工程与应用;2004年01期
【相似文献】
相关期刊论文 前6条
1 于重重;吴子s,
本文编号:1614331
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1614331.html