基于自适应动态规划的无人机编队最优协同控制研究
发布时间:2020-06-22 05:25
【摘要】:本论文基于自适应动态规划(Adaptive Dynamic Programming,ADP)方法,结合一致性理论,对无人机编队的最优协同控制进行研究。首先建立一致性误差动态模型,基于此模型,主要从三个方面深入分析和研究相应的协同控制技术:讨论无人机系统输入受限情形下的一致性问题,讨论无人机系统模型部分未知和模型完全未知情形下的一致性问题。主要内容有:(1)针对编队中的无人机系统存在输入饱和受限情形,提出了分布式自适应最优控制方案求解其非零和微分博弈问题。为解决输入受限造成的不连续问题,选用一个合适的非二次型泛函将问题转化为可求解的优化问题。为每架无人机设计单网络结构来近似耦合哈密顿-雅克比(Hamilton-Jacobi,HJ)方程的解,进而求得分布式最优协同控制律。对于无人机的编队系统,使用单网络而不是自适应动态规划典型的双网结构优势更加突出,因为这样不但可以减少对无人机的内存需求还可以减少计算负担。此外所有无人机的神经网络(Neural Network,NN)权值更新都是同时且连续的,这也使得所得控制律是平滑的。(2)针对模型部分未知的无人机编队系统的最优协同控制问题,提出了基于辨识-评价结构的在线自适应最优控制方案。一般地,非线性非零和微分博弈最优协同控制的关键是耦合HJ方程的求解。由于存在不确定性,针对每一架无人机,分别使用一个辨识NN用于估计无人机系统的未知动态和一个评价NN用于近似耦合HJ方程的解(最优值函数),继而导出最优协同控制律。基于辨识-评价结构,辨识NN和评价NN可以同步调整权值。(3)针对模型完全未知且存在干扰的情形,提出了一种新的数据驱动ADP算法。首先提出了基于模型的策略迭代算法,然后证明了值函数和控制策略的迭代序列收敛于最优函数。为了放松算法对系统模型准确信息的依赖,结合前面基于模型的算法和积分强化学习(Integral Reinforcement Learning,IRL)技术,推导出了无模型(model free)迭代方程。进一步提出一种数据驱动的迭代ADP方法,利用生成的系统数据来求解无模型迭代方程。并且从理论上证明了这种无模型迭代方程等价于基于模型的迭代方程。这意味着数据驱动算法可以近似最优值函数和控制策略。
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:V279;V249.1
【图文】:
虽然单架无人机单独执行任务时会有某些优势,但是多架无人机的协同会带来更大的好处以一定的方式协调多架无人机的移动,以达到某一目标,如许多小型且便宜的无人机一起行动可以取得单个庞大无人机达不到的效果。比如对目标的精确定位、进入狭小洞穴对其测绘或者进入浓密的雨林进行实时环境评估。多个无人飞行器的编队飞行已被确定为许多协同任务的关键技术[1],本质是将成本和复杂度从硬件平台转移到软件和算法上。无人机系统的协同控制对许多民用、国土安全和军事应用也都有潜在的影响。潜在的民用项目包括协同监控森林火灾、油田或管道泄漏和跟踪野生动物等。潜在的国土安全应用包括边境巡逻和监测核电站周边地区军事上的应用包括监视、侦察和战斗损伤评估等。然而,对于所有这些应用,都因通信带宽距离和电源续航能力的约束对集中式的指挥和控制提出了巨大难题。为了使一组无人机保持一定的队形结构,它们之间应该存在信息交互作用。研究编队中无人机的信息流动对理解它们的协同运动起着重要的作用。在目前涉及无人驾驶飞行器的军事场景中,像“捕食者”(见图 1. 1)这样的高配无人机可能具有双向通信能力,而一些微型飞行器可能只有接收信息的能力。无人机编队协同控制在结构上具有个体+通信规则+连通拓扑的特点,且系统整体动力学是由简单的个体行为规则与局部信息产生[2],控制目的就是通过无人机间相互配合以实现协同行为,具有成本低、效率高、自适应性强、维护便捷等优点。
虽然单架无人机单独执行任务时会有某些优势,但是多架无人机的协同会带来更大的好处以一定的方式协调多架无人机的移动,以达到某一目标,如许多小型且便宜的无人机一起行动可以取得单个庞大无人机达不到的效果。比如对目标的精确定位、进入狭小洞穴对其测绘或者进入浓密的雨林进行实时环境评估。多个无人飞行器的编队飞行已被确定为许多协同任务的关键技术[1],本质是将成本和复杂度从硬件平台转移到软件和算法上。无人机系统的协同控制对许多民用、国土安全和军事应用也都有潜在的影响。潜在的民用项目包括协同监控森林火灾、油田或管道泄漏和跟踪野生动物等。潜在的国土安全应用包括边境巡逻和监测核电站周边地区军事上的应用包括监视、侦察和战斗损伤评估等。然而,对于所有这些应用,都因通信带宽距离和电源续航能力的约束对集中式的指挥和控制提出了巨大难题。为了使一组无人机保持一定的队形结构,它们之间应该存在信息交互作用。研究编队中无人机的信息流动对理解它们的协同运动起着重要的作用。在目前涉及无人驾驶飞行器的军事场景中,像“捕食者”(见图 1. 1)这样的高配无人机可能具有双向通信能力,而一些微型飞行器可能只有接收信息的能力。无人机编队协同控制在结构上具有个体+通信规则+连通拓扑的特点,且系统整体动力学是由简单的个体行为规则与局部信息产生[2],控制目的就是通过无人机间相互配合以实现协同行为,具有成本低、效率高、自适应性强、维护便捷等优点。
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:V279;V249.1
【图文】:
虽然单架无人机单独执行任务时会有某些优势,但是多架无人机的协同会带来更大的好处以一定的方式协调多架无人机的移动,以达到某一目标,如许多小型且便宜的无人机一起行动可以取得单个庞大无人机达不到的效果。比如对目标的精确定位、进入狭小洞穴对其测绘或者进入浓密的雨林进行实时环境评估。多个无人飞行器的编队飞行已被确定为许多协同任务的关键技术[1],本质是将成本和复杂度从硬件平台转移到软件和算法上。无人机系统的协同控制对许多民用、国土安全和军事应用也都有潜在的影响。潜在的民用项目包括协同监控森林火灾、油田或管道泄漏和跟踪野生动物等。潜在的国土安全应用包括边境巡逻和监测核电站周边地区军事上的应用包括监视、侦察和战斗损伤评估等。然而,对于所有这些应用,都因通信带宽距离和电源续航能力的约束对集中式的指挥和控制提出了巨大难题。为了使一组无人机保持一定的队形结构,它们之间应该存在信息交互作用。研究编队中无人机的信息流动对理解它们的协同运动起着重要的作用。在目前涉及无人驾驶飞行器的军事场景中,像“捕食者”(见图 1. 1)这样的高配无人机可能具有双向通信能力,而一些微型飞行器可能只有接收信息的能力。无人机编队协同控制在结构上具有个体+通信规则+连通拓扑的特点,且系统整体动力学是由简单的个体行为规则与局部信息产生[2],控制目的就是通过无人机间相互配合以实现协同行为,具有成本低、效率高、自适应性强、维护便捷等优点。
虽然单架无人机单独执行任务时会有某些优势,但是多架无人机的协同会带来更大的好处以一定的方式协调多架无人机的移动,以达到某一目标,如许多小型且便宜的无人机一起行动可以取得单个庞大无人机达不到的效果。比如对目标的精确定位、进入狭小洞穴对其测绘或者进入浓密的雨林进行实时环境评估。多个无人飞行器的编队飞行已被确定为许多协同任务的关键技术[1],本质是将成本和复杂度从硬件平台转移到软件和算法上。无人机系统的协同控制对许多民用、国土安全和军事应用也都有潜在的影响。潜在的民用项目包括协同监控森林火灾、油田或管道泄漏和跟踪野生动物等。潜在的国土安全应用包括边境巡逻和监测核电站周边地区军事上的应用包括监视、侦察和战斗损伤评估等。然而,对于所有这些应用,都因通信带宽距离和电源续航能力的约束对集中式的指挥和控制提出了巨大难题。为了使一组无人机保持一定的队形结构,它们之间应该存在信息交互作用。研究编队中无人机的信息流动对理解它们的协同运动起着重要的作用。在目前涉及无人驾驶飞行器的军事场景中,像“捕食者”(见图 1. 1)这样的高配无人机可能具有双向通信能力,而一些微型飞行器可能只有接收信息的能力。无人机编队协同控制在结构上具有个体+通信规则+连通拓扑的特点,且系统整体动力学是由简单的个体行为规则与局部信息产生[2],控制目的就是通过无人机间相互配合以实现协同行为,具有成本低、效率高、自适应性强、维护便捷等优点。
【参考文献】
相关期刊论文 前2条
1 张化光;张欣;罗艳红;杨s
本文编号:2725260
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/2725260.html