基于BDI的管制员Agent建模技术
发布时间:2017-08-03 23:23
本文关键词:基于BDI的管制员Agent建模技术
更多相关文章: BDI Agent 强化学习 Jadex 管制员建模 多Agent系统
【摘要】:人工智能自20世纪50年代诞生起就受到广泛关注,到目前为止国内外许多著名高校均成立了专门研究人工智能学科的研究机构。多门学科的技术在人工智能有所应用,因此,对人工智能的研究具有一定的挑战性。伴随着计算机技术的发展和全球信息化大潮的推动,人工智能的研究课题和应用领域也在不断扩展。Agent(智能体)作为人工智能理论的一种相对较新的软件模式,将人工智能理论引入到分布式系统的主流领域。国内已经有人运用Agent技术构建了空中交通运行仿真系统,但侧重于构建Agent之间的通信协作关系,并没有从逻辑层面对Agent进行深入建模。针对空中交通仿真系统中的管制员Agent建模问题,本文分析了管制操作行为特点,采用最流行的Agent模型——BDI模型,建立了基于决策树模型的管制规则知识库,设计了慎思型管制员Agent。基于Jadex平台,构建了管制员Agent模型,将由JADE平台建立的航空器Agent和模拟空管自动化系统Agent与Jadex平台建立的管制员Agent进行通信与协调,通过仿真系统构建仿真场景并验证管制员Agent的BDI推理过程,实现了对管制员的日常指挥行为的模拟。同时,考虑到在某些情况下,Agent的先验知识并不完善,需要学习功能对其进行补充,因此,本文提出了管制员Agent的学习行为,并运用Q学习算法对其进行编程实现并对学习效果进行分析。实验结果表明,本文所构建的管制员Agent模型可以顺利进行BDI推理过程和学习行为并对飞行冲突进行探测与解脱,证明了本文构建的BDI模型和学习行为的有效性与合理性。
【关键词】:BDI Agent 强化学习 Jadex 管制员建模 多Agent系统
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18;V355.1
【目录】:
- 摘要4-5
- ABSTRACT5-13
- 缩略词13-14
- 第一章 绪论14-19
- 1.1 研究背景14-15
- 1.2 国内外研究现状15-17
- 1.2.1 BDI Agent系统研究方面15
- 1.2.2 空中交通运行仿真方面15-17
- 1.3 本文的主要研究工作17
- 1.4 本文的内容安排17-19
- 第二章 基于BDI模型的Agent理论研究19-32
- 2.1 Agent定义及体系结构19-21
- 2.1.1 Agent定义19-20
- 2.1.2 Agent体系结构20-21
- 2.2 BDI Agent技术核心21-24
- 2.2.1 BDI Agent基本结构22-23
- 2.2.2 BDI Agent行为产生原理23-24
- 2.3 Jadex BDI Agent平台研究24-31
- 2.3.1 Jadex架构25-26
- 2.3.2 Jadex中的BDI模型26-29
- 2.3.2.1 信念(Belief)26-27
- 2.3.2.2 目标(Goal)27-28
- 2.3.2.3 规划(Plan)28-29
- 2.3.2.4 能力(Capability)29
- 2.3.3 Jadex中的Agent规范29-31
- 2.4 本章小结31-32
- 第三章 管制员Agent模型的实现32-48
- 3.1 管制员Agent的基本BDI模型32-33
- 3.2 管制操作特征分析33-36
- 3.2.1 管制员的行为33-34
- 3.2.2 管制操作流程34-35
- 3.2.3 基于BDI模型的管制员Agent推理过程35-36
- 3.3 管制员Agent的BDI模型设计与实现36-47
- 3.3.1 通信模块39-40
- 3.3.2 感知模块40
- 3.3.3 决策模块40-47
- 3.3.3.1 知识库40-45
- 3.3.3.2 信念库45-46
- 3.3.3.3 推理行为与愿望库46-47
- 3.3.3.4 决策行为与意图库47
- 3.4 本章小结47-48
- 第四章 管制员Agent的学习行为模型48-60
- 4.1 Agent学习行为48-50
- 4.1.1 监督学习48-49
- 4.1.2 无监督学习49
- 4.1.3 强化学习49-50
- 4.2 强化学习算法理论研究50-54
- 4.2.1 强化学习原理与模型50-51
- 4.2.2 强化学习要素51-52
- 4.2.3 学习任务52-53
- 4.2.4 Q学习53-54
- 4.3 管制员Agent的学习行为实现54-59
- 4.3.1 航空器Agent状态信息描述54-56
- 4.3.1.1 航空器Agent高度离散化55-56
- 4.3.1.2 航空器Agent速度离散化56
- 4.3.2 管制员Agent动作描述56-57
- 4.3.3 Q表57-58
- 4.3.4 回报的确定58
- 4.3.5 具体学习行为实现方案58-59
- 4.4 本章小结59-60
- 第五章 管制员Agent模型验证60-79
- 5.1 仿真环境构建60-63
- 5.1.1 开发环境选择60
- 5.1.2 数据库构建60-62
- 5.1.3 仿真空域环境62-63
- 5.1.4 冲突场景构建63
- 5.2 模型验证63-78
- 5.2.1 平台集成63-64
- 5.2.2 通信模块验证64-65
- 5.2.3 感知模块验证65-66
- 5.2.4 决策模块验证66-75
- 5.2.4.1 同航迹冲突解脱66-69
- 5.2.4.2 逆向航迹冲突解脱69-73
- 5.2.4.3 交叉航迹冲突解脱73-75
- 5.2.5 学习行为验证75-78
- 5.3 本章小结78-79
- 第六章 总结与展望79-80
- 6.1 本文总结79
- 6.2 工作展望79-80
- 参考文献80-83
- 致谢83-84
- 在学期间的研究成果及发表的学术论文84-85
- 附录85-91
- 附录1 管制员Agent ADF定义文件代码85-91
- 附录2 冲突飞行计划91
【参考文献】
中国期刊全文数据库 前3条
1 张钧翔;胡明华;;基于多Agent的多机场终端区空中交通智能仿真系统设计[J];交通运输工程与信息学报;2009年02期
2 王超;徐肖豪;;基于Agent的空中交通系统建模与仿真研究[J];计算机工程与应用;2008年31期
3 吕小平;;中国民航新一代空中交通管理系统发展总体框架[J];中国民用航空;2007年08期
中国博士学位论文全文数据库 前1条
1 张洪海;机场终端区协同流量管理关键技术研究[D];南京航空航天大学;2009年
中国硕士学位论文全文数据库 前1条
1 许亚;基于强化学习的移动机器人路径规划研究[D];山东大学;2013年
,本文编号:616810
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/616810.html