无人机集群系统侦察监视任务规划方法
本文关键词: 无人机集群 侦察监视 多智能体系统 不确定规划 马尔科夫决策理论 协调与合作 潘多拉问题和潘多拉规则 人与机器人交互 出处:《国防科学技术大学》2016年博士论文 论文类型:学位论文
【摘要】:如何将无人机集群系统部署于大范围环境中进行侦察监视,是未来无人机军事应用的重要问题之一。一方面,环境中往往分布着大量动态变化的子目标/子任务,亟需自动规划算法,实现无人机集群系统在不确定条件下进行连续侦察监视的快速规划;另一方面,无人机在复杂的环境中进行搜索时,往往需要人辅助提供一些关于环境的知识,所以需要设计良好的人与无人机进行交互的方式,实现在人辅助下进行搜索。基于此,论文的主要工作和创新点如下:(1)针对具有子模性规划目标的多智能体部分可观马尔科夫决策过程(MultiAgent Partially Observable Markov Decision Process,MPOMDP),首次提出了一种近似最优的多智能体在线规划算法。这种算法通过顺次分配技术(Sequential Allocation Technique)来依次计算每个智能体的策略,贪婪地最大化单个智能体对团队任务目标的边际贡献(Marginal Contribution),从而避免了直接考虑团队的联合策略(其导致的计算代价与智能体个数呈指数关系),使得计算复杂度随智能体个数呈多项式关系。论文通过理论证明该算法具有很好的近似最优性能。创新性工作为:使用顺次分配技术来计算智能体的策略,相比于其他的搜索团队联合策略空间的方法,这种方法具有很好的可扩展性,并能够满足问题的实时性要求。(2)针对传递函数解耦的部分可观马尔科夫决策过程(Transition-Decoupled POMDP,TD-POMDP),首次提出了具有良好可扩展性的在线规划算法——传递函数解耦的部分可观蒙特卡洛规划(Transition-Decoupled Partially Observable Monte-Carlo Planning,TD-POMCP),即一种基于蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)和max-sum的分散式在线算法。TD-POMCP的创新主要包括:1)根据局部智能体团队的局部联合动作和联合观测,利用TD-POMDP模型中变换依赖的弱耦合关系,对每个智能体分别构建一个前向搜索树;2)基于MCTS这种基于采样的搜索算法对每个智能体的搜索树进行扩展和更新;3)所有智能体通过分散式交互的方式同时进行对各自搜索树的扩展和更新。在搜索树中的每个规划步骤,通过max-sum这种分散式任意时间近似算法进行智能体的动作选择。论文通过理论证明这种方法具有很好可扩展性、鲁棒性、实时性和最优性,并且通过相关的仿真实验证明论文的方法可以成功应用于大规模TD-POMDPs。(3)基于MPOMDP和TD-POMDP模型,分别建立了在威胁环境和不确定性下的无人机集群系统进行侦察监视的集中式和分散式问题模型。这些问题的状态空间大小随环境中监视子目标个数的增加呈指数增长,使得通用的规划求解器无法求解这种大范围的侦察监视问题,更无法满足实际任务的实时性要求。因此,论文设计了随监视子目标个数线性增长的信念状态表示方式,并进一步定义了无人机集群系统侦察监视问题的形式化模型。基于此,设计了仿真实验,实验结果表明论文的算法能够成功应用于大规模无人机团队在大范围环境中进行集中式/分散式侦察监视的规划问题。与现有的侦察监视问题的求解方法相比,论文设计的问题模型与求解算法的创新点包括:1)基于智能体模型描述了无人机与环境和与其他无人机之间的交互方式;2)环境的模型能够表达其在时间和空间上的部分可观和非静态性质;3)求解算法在进行蒙特卡洛仿真时,通过不断保持对健康约束的检测,在规划中能够处理无人机可能遭受的来自威胁的伤害。(4)针对概率知识和人辅助下进行搜索的决策问题,建立了一个新颖的模型,即机器人和人的搜索问题(Robot-Human Search,RHS)。RHS描述了一类不确定知识下的搜索问题:一架自主无人机在人的有限辅助下,搜索环境中的某一物体(如一架坠落战机的碎片)。环境中的不确定性体现在物体的回报值以及人的可利用性(Availability)。无人机的目标是最大化所获物体的回报值并最小化总的搜索代价。论文证明这一结合人辅助的搜索问题在多项式时间内可解,这一结论在之前的文献研究中并未得出过。进一步,通过仿真实验来验证论文提出的方法,实验结果证明论文的方法显著优于一些基准算法。
[Abstract]:This paper presents an approximate optimal multi - agent on - line planning algorithm , which is based on Sequential Allocation Technique . The paper designs a distributed online algorithm based on Monte Carlo Tree Search ( MCTS ) and max - sum . ( 4 ) A novel model , called Robot - Human Search ( RHS ) , is established for the decision - making problem with probabilistic knowledge and human assistance . RHS describes a class of uncertain knowledge search problems : an autonomous unmanned aerial vehicle searches for an object in the environment , such as a falling fighter , under the limited assistance of a person . The uncertainty in the environment is reflected in the return value of the object and the availability of people . The goal of the unmanned aerial vehicle is to maximize the return value of the object and minimize the total search cost .
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:V279;V249;O225
【相似文献】
相关期刊论文 前10条
1 吴皓;曲玉琨;杨彪;黄亚;;无人机作战实验室建设[J];实验室研究与探索;2009年03期
2 张晓敏;;舰载无人机作战使用研究[J];科技信息;2010年17期
3 李磊;熊涛;胡湘阳;熊俊;;浅论无人机应用领域及前景[J];地理空间信息;2010年05期
4 王宪伦;;关于无人机应用安全问题的一点探讨[J];测绘与空间地理信息;2011年01期
5 吕厚谊;无人机发展与无人机技术[J];世界科技研究与发展;1998年06期
6 段歆涔;;无人机将走向何方[J];科学新闻;2013年07期
7 徐秉君;;未来天空的主角——无人机——访空军首批试飞专家、航空航天“月桂奖·英勇无畏奖”获得者毕红军[J];科技创新与品牌;2011年08期
8 ;攻击无人机的种种杀手锏[J];新科幻(科学阅读版);2012年01期
9 肖鹏;;海空精灵——管窥世界舰载无人机[J];科学24小时;2012年10期
10 李勃;黄大庆;;基于电磁环境效应的无人机系统级电磁辐射指标制定[J];武汉大学学报(理学版);2007年03期
相关会议论文 前10条
1 王林;张庆杰;朱华勇;沈林成;;远程异地多无人机系统控制权切换技术研究[A];2009中国控制与决策会议论文集(3)[C];2009年
2 谭健美;张琚;闫娟;;信息无人机系统——无人机发展史上新的里程碑[A];第二届中国航空学会青年科技论坛文集[C];2006年
3 黄爱凤;邓克绪;;民用无人机发展现状及关键技术[A];第九届长三角科技论坛——航空航天科技创新与长三角经济转型发展分论坛论文集[C];2012年
4 刘长亮;;无人机发动机气道开度自适应机构的设计与实现[A];2009年中国智能自动化会议论文集(第三分册)[C];2009年
5 丁霖;;无人机系统人机交互界面浅析[A];探索 创新 交流(第4集)——第四届中国航空学会青年科技论坛文集[C];2010年
6 刘泽坤;吕继淮;;舰载无人机系统的环境适应性[A];人—机—环境系统工程创立20周年纪念大会暨第五届全国人—机—环境系统工程学术会议论文集[C];2001年
7 叶烽;宋祖勋;;无人机系统电磁兼容性测试研究[A];第十四届全国电磁兼容学术会议论文集[C];2004年
8 易当祥;吕国志;沈玲玲;;多级路况下车载无人机疲劳载荷仿真[A];第十二届全国疲劳与断裂学术会议论文集[C];2004年
9 钱正祥;金继才;杨鹭怡;;未来局部战争中反无人机作战对策研究[A];探索创新交流--中国航空学会青年科技论坛文集[C];2004年
10 高鹏骐;晏磊;赵红颖;何定洲;;无人机遥感控制平台的设计与实现[A];第十五届全国遥感技术学术交流会论文摘要集[C];2005年
相关重要报纸文章 前10条
1 洪山;法国、德国和西班牙签约共同研发三国无人机系统[N];中国航空报;2007年
2 崔玺康;对抗无人机所面临的新挑战[N];中国航空报;2007年
3 林英;无人机将进入现代化农业领域[N];光明日报;2007年
4 本报记者 陈永杰 马佳;中国无人机亮相:战争“零伤亡”将实现[N];北京科技报;2008年
5 祖茜枫;“综合者”:携带小导弹的小无人机[N];中国国防报;2008年
6 王磊;印度期望打造强大无人机部队[N];学习时报;2009年
7 李荔;无人机“俯瞰”黄河灾情[N];北京科技报;2011年
8 本报记者 宋斌斌;我国无人机应用高端化趋势明显[N];中国工业报;2011年
9 吴飞;反恐十年无人机扶摇直上[N];中国航空报;2011年
10 司古;美无人机遭神秘病毒入侵[N];国防时报;2011年
相关博士学位论文 前10条
1 刘洋;动态环境中的无人机路径规划研究[D];西北工业大学;2015年
2 高九州;无人机自主着陆控制[D];中国科学院研究生院(长春光学精密机械与物理研究所);2016年
3 杨永明;无人机遥感系统数据获取与处理关键技术研究[D];昆明理工大学;2016年
4 孙小雷;基于多阶段航迹预测的无人机任务规划方法研究[D];哈尔滨工业大学;2015年
5 张艳超;农田信息低空遥感中图像采集与处理的关键技术研究[D];浙江大学;2016年
6 王刚;一种螺旋桨动力配平的小型电动无尾无人机研究[D];西北工业大学;2016年
7 张潮;神经智能控制在小型快递无人机系统中的研究与应用[D];北京科技大学;2017年
8 李辰;面向四旋翼无人机的非线性控制方法与实现[D];浙江大学;2017年
9 徐博;植保无人机航线规划方法研究[D];中国农业大学;2017年
10 王国芳;专家知识辅助的强化学习研究及其在无人机路径规划中的应用[D];浙江大学;2017年
相关硕士学位论文 前10条
1 赵敏;分布式多类型无人机协同任务分配研究及仿真[D];南京理工大学;2009年
2 刘志花;无人机故障预测与健康管理技术研究[D];北京化工大学;2010年
3 刘爱兵;可变形无人机设计[D];南京航空航天大学;2009年
4 易姝姝;无人机飞行场景及数据的可视化仿真与实现[D];电子科技大学;2010年
5 张佳璐;无人机项目综合评价研究[D];北京邮电大学;2011年
6 赵志鸿;某型无人机双发火箭助推发射动力学建模与仿真研究[D];南京理工大学;2007年
7 李建华;某无人机发射系统技术研究[D];南京理工大学;2008年
8 戴世通;无人机飞行可视化仿真系统设计[D];西安理工大学;2008年
9 曹攀峰;敌对与非敌对环境下无人机群的协同搜索路径与策略研究[D];复旦大学;2010年
10 张锡宪;无人机测控中数据传输系统设计与实现[D];电子科技大学;2009年
,本文编号:1522295
本文链接:https://www.wllwen.com/kejilunwen/yysx/1522295.html