当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于统计前向规划算法的游戏通用人工智能

发布时间:2022-01-17 17:23
  统计前向规划(statistical forward planning,SFP)算法使用仿真模型(也称为前向模型)自适应地搜索有效的动作序列,此类算法提供了一种简单通用的方法,为各种游戏提供快速自适应的AI控制。介绍了两种常用的SFP算法:蒙特卡罗树搜索和滚动层进化,并证明了在没有任何事先训练的情况下,SPF算法就可以在各种视频游戏中出色地运行。 

【文章来源】:智能科学与技术学报. 2019,1(03)

【文章页数】:9 页

【部分图文】:

基于统计前向规划算法的游戏通用人工智能


用于预测中心瓦片下一个状态的本地局部邻域模式

模型图,模型,决策树,正向


有很多实现局部正向模型学习的算法,例如Hash图和决策树模型。不完美的模型也是很有用的,可以提供不错的结果。从图3可以看到,3种状态的结果基本是一致的,但是有的时候也会出现一些错误,不过正如之前说的,不是完美的方法才有用,这个局部模型在很大程度上是适用的。2.3 可解释性

示例,网格,状态,前向模型


以推箱子游戏来说明这一学习过程,推箱子属于一个解谜游戏,如图1所示,玩家(小矮人)必须将所有的箱子(灰色方块)推入目标(橙色圆圈)才能通过关卡。如果想把箱子推到指定位置,需要先把箱子推到另一侧,让游戏的个体能够把箱子从另一个方向推动到目标位置,这是一个典型的基于网格的游戏模型。这个游戏可以使用局部模型依次建立前向模型,从而确定对应动作。在这个游戏中,状态可以表示为一组排列在网格中的瓦片,其中T(x,y)代表处于网格中位置为(x,y)的瓦片。游戏的目标是根据单元格的状态tA以及它在t时刻的局部邻域状态N(x,y)t来预测每个瓦片在t+1时刻的状态T(x,y)t+1。令局部状态转换函数fx,y为:


本文编号:3595133

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3595133.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5d93a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com