当前位置:主页 > 科技论文 > 搜索引擎论文 >

人工智能与“星际争霸”:多智能体博弈研究新进展

发布时间:2021-01-11 19:11
  多智能体博弈游戏具有实时对抗、群体协作、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题。同时,该领域研究成果在社会管理、智能交通、经济、军事等领域有广阔的应用前景。以具有代表性的多智能体博弈游戏"星际争霸"为主要研究对象,通过分析研究难度、总结研究方法、介绍研究环境及数据集与竞赛资源,对近年来该领域人工智能研究成果进行了梳理和总结,并对该领域未来可能的发展方向进行预测,为相关研究工作的开展提供可借鉴参考信息。 

【文章来源】:无人系统技术. 2019,2(01)

【文章页数】:12 页

【部分图文】:

人工智能与“星际争霸”:多智能体博弈研究新进展


星际争霸I竞赛环境Fig.1StarCraftIcompetitionenvironment

环境,状态空间,棋类,竞赛环境


都有一定概率促成最后的胜利。(4)巨大的搜索空间及多复杂任务。实时策略游戏更复杂,其在状态空间的规模上和每个决策环节可选择的动作序列均非常巨大。例如,就状态空间而言,一般的棋类游戏状态空间在1050左右,德州扑克约为1080,围棋的状态空间为10170。而星际争霸一个典型地图上的状态空间比所有这些棋类的状态空间都要大几个量级。以一个典型的128×128像素地图为例,在任何时候,地图上可能会有5~400个单元,每个单元都可能存在一图1星际争霸I竞赛环境Fig.1StarCraftIcompetitionenvironment图2星际争霸II游戏环境Fig.2StarCraftIIgameenvironment

多智能体,难点,策略,对应关系


≈35,d≈80,围棋b≈30~300,d≈150~200,而星际争霸b的范围是1050~10200,d≈36000。多智能体实时策略游戏的这些突出难点给该领域人工智能研究方法带来巨大挑战。文献[2]将本领域研究中的挑战总结为规划、学习、不确定性、时空推理、领域知识开发和任务分解六个方面。在此基础上,我们将当前研究中的挑战分为多尺度规划与多层次决策一致性、多途径策略学习、降低不确定性、空间和时间上的多模联合推理、领域知识开发和多层次任务分解六大挑战。本领域研究难点与研究挑战的对应关系如图3所示。特点挑战规划与决策策略学习降低不确定性空间和时间推理领域知识开发多层次任务分解巨大搜索空间和多复杂任务非完整信息搏弈及不确定性实时对抗及动作持续性多玩家共存及多智能体合作图3多智能体实时策略游戏存在的难点与人工智能研究挑战的对应关系Fig.3Correspondencebetweenthedifficultiesofmulti-agentreal-timestrategygamesandthechallengesofartificialintelligenceresearch(1)多尺度规划与多层次决策一致性。一方面,由于多智能体游戏中巨大的状态空间和可输出动作,使得一般的对抗规划方法如博弈树搜索已不能满足需求,多智能体实时策略游戏需要多尺度的规划。另一方面,实时约束为多异构智能体大量的低层次动作规划与高层次全局决策目标的一致性耦合带来很大困难,难点在于设计一种既考虑复杂多目标优化又兼顾计算效率的方法,最终形成多智能体整体行动的实时一致性。(2)多途径策略学习。除对抗规划技术之外,一些研究团队将注意力放在多途径策略学习技术上,其中包含三种策略学习问题。一是提前学习,即开发已有数据,如已有游戏回放、已有的针对特定地


本文编号:2971320

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2971320.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户daa30***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com