增强学习在共面双机空战格斗中的应用
发布时间:2020-11-20 14:28
微分对策作为解决追逃动态对策问题主要工具已经经历了近50年的发展,就其本身而言已经发展的相当成熟,但距实际应用还有一段距离。这主要是由于微分对策理论来源于最优控制理论,因此它需要精确的数学模型,以及在求解时会遇到非线性两点边值问题和奇异面问题。 近年来,随着人工智能的兴起,国内外许多学者致力于将智能控制理论引入微分对策理论的研究中。而要达到智能化制导就不可避免地涉及知识的自动提取和利用问题。作为机器学习的一种方法,增强学习恰可使知识的获取过程自动化,并扩展所能得到的知识资源范围。 本文研究了共面双机空战格斗的动态对策问题,采用增强学习与微分对策相结合的方法,避免了传统的控制理论根据被控对象的精确数学模型和性能指标来求解最优解析解的方法带来的困难。并依据人的模糊思维建立空战对策准则,实现状态空间的离散化以减小动作空间范围,提高网络学习效率。 本文针对传统增强学习中出现的“维数灾难”问题以及学习问题中的“Structure Credit-Assignment”问题采用BP神经网络近似Q-学习的评价函数的解决方法。 在仿真试验中考虑诸多实际因素,并采用了实际空气动力学参数,仿真结果验证本文所采用的方法的有效性,表明将增强学习与微分对策理论相结合,并应用于空战格斗问题中是—种有前途的发展方向。 本文首先分析双机格斗的重要性及其研究方法的发展,并给出设计方案的依据及总体框架。在第二章介绍了增强学习的特点、发展历史和各种算法。在第三章设计了基于Q-学习智能空战制导控制,并给出空战对策准则。在第四章对水平面双机空战格斗常、变速数学模型进行了仿真试验,对仿真结果作了分析。
【学位单位】:沈阳工业大学
【学位级别】:硕士
【学位年份】:2003
【中图分类】:E84
【部分图文】:
图4.10均方残差变化趋势图仿真参数分析现代的高科技条件下,各种飞行器的速度越来越高,机动性越来越强,也使得进飞行器的拦截更加困难。因此,高技术战争也对拦截飞行器的追踪捕获能力高的要求,即希望追逐方能够快速发射并迅速追踪任意方向上的目标,己达到的目的。本仿真试验在4.L4节仿真试验的基础上,采用了更接近实际的空战模型,选取不同的初始条件不逃逸方的初始角度)进行了仿真试验,并进行了一、空战格斗数学模型的建立逃双方的运动方程为:X二叱*eos(护,)
【参考文献】
本文编号:2891553
【学位单位】:沈阳工业大学
【学位级别】:硕士
【学位年份】:2003
【中图分类】:E84
【部分图文】:
图4.10均方残差变化趋势图仿真参数分析现代的高科技条件下,各种飞行器的速度越来越高,机动性越来越强,也使得进飞行器的拦截更加困难。因此,高技术战争也对拦截飞行器的追踪捕获能力高的要求,即希望追逐方能够快速发射并迅速追踪任意方向上的目标,己达到的目的。本仿真试验在4.L4节仿真试验的基础上,采用了更接近实际的空战模型,选取不同的初始条件不逃逸方的初始角度)进行了仿真试验,并进行了一、空战格斗数学模型的建立逃双方的运动方程为:X二叱*eos(护,)
【参考文献】
相关期刊论文 前10条
1 周锐,李惠峰;神经网络理论在微分对策中的应用[J];北京航空航天大学学报;2000年06期
2 吴云洁,宋立国,姜玉宪;飞行综合控制系统空战决策方法[J];北京航空航天大学学报;1999年03期
3 张凤霞,王丕宏,李锋;基于神经网络的自动机动决策设计[J];电光与控制;2001年03期
4 于黎明,王占林,裘丽华;辅助驾驶员操纵的预见显示及预测控制[J];飞行力学;1999年03期
5 刘长有,张嗣瀛;共面变速拦截对策的一个统一的近似反馈解[J];航空学报;1989年09期
6 顾冬雷,陈卫东,席裕庚;机器人足球赛中基于增强学习的任务分工[J];机器人;2000年06期
7 张汝波,顾国昌,刘照德,王醒策;强化学习理论、算法及应用[J];控制理论与应用;2000年05期
8 周锐,陈宗基;强化学习在导弹制导中的应用[J];控制理论与应用;2001年05期
9 周锐,陈宗基;遗传算法在逃逸机动策略中的应用研究[J];控制与决策;2001年04期
10 蒋国飞,吴沧浦;基于Q学习算法和BP神经网络的倒立摆控制[J];自动化学报;1998年05期
本文编号:2891553
本文链接:https://www.wllwen.com/shekelunwen/renwuzj/2891553.html