基于协作机制的多Agent追捕研究
本文选题:多智能体系统 切入点:追逃 出处:《哈尔滨工业大学》2017年博士论文 论文类型:学位论文
【摘要】:基于agent的模型(ABMs)在人工智能及虚拟现实等领域一直都是在试图模仿人类的行为,在一个人工环境中,为了产生许多社会科学家可以理解的可能现象,agent的决策模块要互相影响并进行交互。这个定义对于那些不是在分布式人工智能(DAI)的专家来说并不是特别清楚,但是如果考虑到那些反映了特殊类型的ABM鼎鼎大名的视频游戏,它确实提供了一个明确的意义。事实上,视频游戏将虚拟世界的玩家和一些互动的人物整合了起来,例如:怪物,追兵,逃跑者、宇航员、士兵等。这些agent中的每一个在特定的情况下都在进行一种特定的并且规则的行为(一种行为算法),最重要的是,agent可以与其他agent进行交互。然而,游戏也有很大的概率随机产生许多不同的结果,电子游戏基于每个agent的交互性而可以产生大量不确定的事件。在基于agent的不同领域,如任务协调和路径规划等,移动agent在未知环境下的追捕成为一个最有趣的挑战,该论文的总体目标是提出基于组织框架和博弈论的理论多agent系统的协作机制,以检查和解决一些涉及多智能体的追捕及逃脱的问题。该联盟机制将允许agent合作和自己协调自身任务,及时和有效地实现全局目标。在路径规划方面,提出了一种基于随机马尔可夫运动策略决策过程的方法(MDP)。此外,还开发了一种避障算法,允许agent在遇到的障碍时可以采取一些有效的方法。仿真实验的目标是展示这些不同的机制在追捕的过程中如何影响的捕获时间和内在学习的过程。本文共分为五章:第1章介绍了工作的主要目标以及对一些相关工作的原理及结果的介绍。该章节专注于探索适用于多Agent系统不同的任务和路径规划方法。此外,考虑到这些机制在关系到追捕和逃避问题的应用。这些章节的最后是关于论文工作的一些规范的介绍。第2章提出了一种基于Agent-组-角色(AGR)模型的联盟形成算法。该算法的应用为了衡量对不同的捕获者追捕群组的影响的形成及其面不同追捕者的稳定性。在这个模型中,多个agent通过提出获得群组中的角色来形成群组。在联盟形成过程中,agent必须在群组创建的过程中执行一组特定的任务,以实现固定的目标。为了控制agent的运动策略,利用基于马尔可夫的决策过程(MDP)的方法,允许在合作的多agent系统中通过使用奖励和转移函数来决策问题。第3章简述了其他两个基于组织原则的任务协调机制。以定义一个抓捕群组组访问机制为目标,提出了一个YAMAM模型任务协调机制(Yet Another Multi-Agent Model)。确定了一些agent,角色,任务和技能等概念来形成这个抓捕逃脱问题的框架,并优化的不同追逐群组组之间的任务共享机制。开发了一个灵活的基于模糊逻辑理论的AGR模型。该模型的目的是让不同群组互动、组织和动态重组。在追逃问题上,提取出了不同程度的灵活性的组织模型的分组算法,突出了对逃跑者的捕获时间以及对动态重组的发展在任务执行过程中的积极作用。在4章中,提出了一种迭代剔除劣势策略分散的联盟形成算法(IED)。这种博弈论决策过程是常见的解决问题的方法,该过程需要反复挑选出的占主导地位的战略,以确定通过这种方法达到平衡。第5章重点研究了在追求目标的过程中所遇到的复杂的障碍如U和H的处理,提出了基于bug算法和通过MDP的应用来生成奖励的方法来实现避障。这个新的过程称为奖励错误算法(RBA),提高了agent上传感器返回的环境数据的使用效率,证明了(RBA)是如何提高追捕者的目标转向正确率以及他们在障碍物躲避上的决策的效率。
[Abstract]:......
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP18
【相似文献】
相关期刊论文 前10条
1 ;Approach to Weighted Geometric Evaluation Based on Projection Pursuit[J];Engineering Sciences;2006年01期
2 ;A New Optimization Neural Network for High Resolution Time-Frequency Analysis[J];电路与系统学报;1997年01期
3 Jun Li;Wen-Long Song;Yu-Rong He;;Research of Multiagent Coordination and Cooperation Algorithm[J];Journal of Harbin Institute of Technology;2013年03期
4 ;COMPRESSED SPEECH SIGNAL SENSING BASED ON THE STRUCTURED BLOCK SPARSITY WITH PARTIAL KNOWLEDGE OF SUPPORT[J];Journal of Electronics(China);2012年Z1期
5 ;A NEW APPROACH FOR UNSUPERVISED RESTORING IMAGES BASED ON WAVELET-DOMAIN PROJECTION PURSUIT LEARNING NETWORK[J];Journal of Electronics(China);2003年05期
6 Nguyen ThanhSon;Guo Shuxu;Chen Haipeng;;EFFECT OF MULTIPATH CHANNEL MODELS TO THE RECOVERY ALGORITHMS ON COMPRESSED SENSING IN UWB CHANNEL ESTIMATION[J];Journal of Electronics(China);2013年03期
7 赵治栋;杨雷;陈甸甸;;基于FFT-Matching Pursuit的心电身份识别算法研究[J];传感技术学报;2013年03期
8 ;Coordination of multiple mobile robots with limited communication range in pursuit of single mobile target in cluttered environment[J];Journal of Control Theory and Applications;2010年04期
9 ;NEW BOOKS[J];China's Tibet;2009年02期
10 ;A DISTRIBUTED COMPRESSED SENSING APPROACH FOR SPEECH SIGNAL DENOISING[J];Journal of Electronics(China);2011年Z1期
相关会议论文 前10条
1 Maha Chakri Sirindhorn;;The Pursuit of Knowledge as a Form of Promoting Social Progress[A];文明的和谐与共同繁荣——北京论坛(2004)论文选集[C];2004年
2 严德志;于凤芹;;基于Matching Pursuit的音像信号的分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
3 ;Study on a Solution of Pursuit-evasion Differential Game Based on Artificial Fish School Algorithm[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
4 ;A PSO Solution for Pursuit-evasion Problem of Randomly Mobile Agents[A];2009中国控制与决策会议论文集(3)[C];2009年
5 ;Time-Lag Effect on the Capture Capability of Pursuit-Control[A];第二十六届中国控制会议论文集[C];2007年
6 ;Fuzzy Logical Guidance Based on Particle Swarm Optimized Parameters[A];第二十七届中国控制会议论文集[C];2008年
7 ;A New Multiple Attribute Decision Making Method Based on Preference and Projection Pursuit Clustering Model[A];中国自动化学会控制理论专业委员会D卷[C];2011年
8 ;In the Pursuit of Vyakarana-elements in Chinese Translations[A];文明的和谐与共同繁荣:人类文明的多元发展模式——北京论坛(2007)论文选集[C];2007年
9 杨熙;王金枝;;多智能体系统一致性的鲁棒性分析[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
10 张亚;田玉平;;离散时间多智能体系统一致的权重条件[A];中国自动化学会控制理论专业委员会B卷[C];2011年
相关重要报纸文章 前2条
1 记者 田蓓蕾;全市二○○六年反腐败重点任务协调组工作会议召开[N];辽源日报;2006年
2 记者 胡加齐;墨西哥发明盲人电子避障装置[N];新华每日电讯;2000年
相关博士学位论文 前10条
1 苏迪(Mohammed El Habib Souidi);基于协作机制的多Agent追捕研究[D];哈尔滨工业大学;2017年
2 王振华;具有通信时滞的线性多智能体系统的趋同[D];山东大学;2015年
3 郑宝杰;多智能体系统若干包含控制问题研究[D];郑州大学;2015年
4 张方方;多智能体系统分布式优化控制[D];山东大学;2015年
5 龙晓军;多智能体系统的有限时间一致性跟踪[D];大连海事大学;2015年
6 杨新荣;广义多智能体系统的一致性问题研究[D];哈尔滨工业大学;2015年
7 夏红;多智能体系统群一致性与编队控制研究[D];电子科技大学;2014年
8 李金沙;多智能体系统一致性学习协议的设计与分析[D];西安电子科技大学;2015年
9 黄捷;高阶非线性多智能体系统一致性控制研究[D];北京理工大学;2015年
10 杨大鹏;多智能体系统的事件驱动一致性控制与多Lagrangian系统的分布式协同[D];北京理工大学;2015年
相关硕士学位论文 前10条
1 李沛;翻译报告:感性文化与理性文化-摘自 The Pursuit of Glory: Europe 1648-1815[D];云南大学;2014年
2 孟亚伟;一类具有时滞和领导者的二阶多智能体系统的一致性[D];重庆师范大学;2013年
3 刘孝琪;多智能体系统一致性及其在蜂拥控制中的应用研究[D];电子科技大学;2013年
4 王琛阳;带领导者的多智能体系统一致性问题研究[D];河北大学;2015年
5 陈小龙;基于量化信息的多智能体系统状态估计[D];西南交通大学;2015年
6 王航飞;基于事件驱动的多智能体系统的环形编队控制研究[D];华北电力大学;2015年
7 陈文秀;离散时间广义多智能体系统的容许一致性[D];温州大学;2015年
8 张文涛;多智能体系统分布式协调控制的相关问题研究[D];浙江师范大学;2015年
9 曹伟俊;带有扰动的多智能体系统的一致性研究[D];北京化工大学;2015年
10 成照萌;多智能体系统的模型预测控制[D];华中科技大学;2015年
,本文编号:1601936
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1601936.html