当前位置:主页 > 科技论文 > 船舶论文 >

无人艇集群最优协同控制反演

发布时间:2021-11-18 10:51
  为实现通过数据驱动学习人为操作下的无人艇集群最优协同控制策略,文中提出了一种线性二次型闭环微分博弈反演优化算法,根据观测到的系统最优状态和控制输入轨迹辨识协同策略目标函数。首先,根据观测到的含加性白噪声的最优系统状态和控制输入轨迹辨识最优反馈矩阵;然后,通过求解由纳什平衡充要条件推出的耦合代数黎卡提方程的解来辨识协同策略目标函数。所提出的反演优化算法能够获得满足给定系统状态和控制输入轨迹的最优协同策略目标函数;同时,该算法辨识出的目标函数可以用于实现针对特定任务场景的无人艇集群最优协同控制,并为集群的对抗博弈提供新的思路和解决方案。 

【文章来源】:水下无人系统学报. 2020,28(06)北大核心

【文章页数】:7 页

【部分图文】:

无人艇集群最优协同控制反演


闭环微分博弈框图Fig.1Blockdiagramofclosed-loopdifferentialgame

场景,反馈矩阵,优化模型,反演


2020年12月张振华,等:无人艇集群最优协同控制反演第6期水下无人系统学报www.yljszz.cn615无人艇集群最优协同控制反演优化算法流程如下。1)建立采集到的纳什平衡条件下无人艇集群运动状态和每个操作人员对单艘无人艇的控制输入信息模型**[][][],1:[][][],1:iiikkkkMkkkkMxxvuuw(18)式中:[][]ixk和uk分别代表k时刻采集到的无人艇集群系统状态量和第i艘无人艇的控制输入量;[][]ivk和wk代表k时刻的叠加噪声。2)辨识各个无人艇的最优反馈矩阵*iK。由于在实际应用中很难直接获取到各艇的最优反馈矩阵,所以往往需要通过观测信息来辨识控制律。使用x[k]和[]iuk,通过最小二乘法辨识纳什平衡下各艇的最优反馈矩阵*221argmin[][]iiiikxkukMKKK(19)3)建立反演优化模型。根据式(2)、式(7)和式(19),对无人艇集群最优协同控制反演优化问题建立如下优化模型2*T1Tmin()s.t.()()0()()iiiiFiiiiiiiiiijjijjjiiiiijiθKθKPASPASPPQPSPKθRBPθ(20)式中,iijQ和R均为正定矩阵。4)求解优化模型。通过求解式(20)即可得到待辨识的参数iθ,但该模型属于双层优化问题,在直接求解过程中需要不断解内层耦合的代数黎卡提方程,计算量大。因此,根据引理1和式(10),利用耦合黎卡提的解将式(20)转化为简单的最小二乘优化问题,即式(21),以实现快速求解,增加算法实时性。22mins.t.00iiiLiiiθMθIθR(21)

分布图,相对误差,噪声,条件


分布和统计直方图分别如图3和图4所示。图3无噪声条件下相对误差分布图Fig.3Diagramofelativeerrordistributionundernoiselesscondition图4无噪声条件下相对误差统计直方图Fig.4Histogramofrelativeerrorstatisticalundernoiselesscondition如在求解正向微分博弈协同控制问题时得到的系统状态和控制输入轨迹上叠加30dB高斯白噪声,且加入一定先验知识(已知(1,1),(1,1)iijQR),则所获得的系统状态预测相对误差分布和统计直方图情况分别如图5和图6所示。图530dB噪声条件下相对误差分布图Fig.5Diagramofrelativeerrordistributionunder30dBnoisecondition图630dB噪声条件下相对误差统计直方图Fig.6Histogramofrelativeerrorstatisticalunder30dBnoisecondition


本文编号:3502766

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/chuanbolw/3502766.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户62c11***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com