基于深度强化学习的第一人称射击游戏研究
发布时间:2022-01-04 00:16
深度强化学习结合了深度学习和强化学习的优势,近来在游戏、机器人、自动驾驶、推荐系统等多个领域有了巨大突破。其中,游戏领域具有简单快捷的数据采样优势,极大地方便了深度强化学习的研究。虽然深度强化学习在Atari 2600游戏和棋类游戏中展现了超越人类的得分能力,但是在第一人称射击(First-person Shooting,FPS)游戏等复杂任务中仍然面临重要挑战。基于ViZDoom平台,本文分析了FPS游戏的特点,有针对性地提出了智能体分解方案,并且采用了多任务学习方法。主要研究内容如下:(1)FPS游戏通常面临着复杂的离散动作空间,多样的任务挑战和难以分配的游戏奖励,本文提出智能体分解方案来解决这些问题。智能体分解是将一个智能体从动作空间、任务类型和奖励分配三个层面进行分解,以此来应对更复杂的任务挑战。其一,本文提出语义动作空间分解方法,按照动作的组合规律和实际意义将原始动作空间分解成若干个动作子空间,每个动作子空间对应了一个Q网络分支,降低了原始动作空间的复杂程度。其二,本文提出任务分解方法,将复合任务分解为导航和进攻两个子任务,每个子任务包括若干个相关的Q网络分支,降低了复合任务...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
第一人称视角和第三人称视角游戏的对比
ViZDoom中的不同场景
学习率对实验结果的影响
本文编号:3567262
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
第一人称视角和第三人称视角游戏的对比
ViZDoom中的不同场景
学习率对实验结果的影响
本文编号:3567262
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3567262.html
最近更新
教材专著