基于人工智能的星际争霸Ⅱ智能体研究与实现
发布时间:2022-02-22 01:25
近年来,随着人工智能技术的发展,人工智能技术已经在许多游戏领域取得了超越最顶级人类玩家水平的成绩。但是,其在星际争霸类即时战略类游戏中并没有取得令人满意的成绩。因为,星际争霸类游戏是由不完全信息博弈、巨大动作空间、实时性需求、长期规划和多智能体协作等多个问题构成的复杂性系统问题。目前,许多表现优异的星际争霸II智能体大都依赖于硬编码策略,几乎不能因对手所采取的策略的不同而做出适当的调整。本课题使用深度学习算法从顶级玩家的比赛游戏回放中学习玩家的生产策略,并将学习到的生产策略应用到现有的复杂智能体中,从而提高其竞争性。本文首先通过预处理、解析、提取游戏特征等流程从SC2LE(StarCraft II Learning Environment)提供的120多万场游戏回放中构造数据集。然后使用LSTM网络训练预测人族对抗人族、虫族和神族的下一步生产动作的网络模型,分别取得了80.19%、80.05%和79.58%的准确率。接着再将训练的预测人族对抗各种族下一步生产动作的网络模型集成到星际争霸II开源智能体——CommandCenter中,改进其原有的Production Manager模块和...
【文章来源】:西南交通大学四川省211工程院校教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 主要研究工作
1.4 论文组织结构
1.5 本章小结
第2章 基于SC2LE构建游戏特征数据集
2.1 SC2LE简介及搭建
2.1.1 星际争霸II客户端和SC2API
2.1.2 PySC2
2.1.3 游戏回放数据集
2.1.4 搭建SC2LE平台
2.2 构建游戏特征数据集
2.2.1 实验环境
2.2.2 预处理
2.2.3 解析游戏回放
2.2.4 特征提取
2.2.5 归一化
2.2.6 划分
2.3 本章小结
第3章 游戏智能体下一步生产动作的预测
3.1 基于多层感知机的下一步生产动作的预测
3.1.1 网络架构
3.1.2 网络实现细节
3.1.3 实验及分析
3.2 基于LSTM网络的下一步生产动作的预测
3.2.1 LSTM网络架构
3.2.2 LSTM网络实现
3.2.3 实验及分析
3.3 本章小结
第4章 智能体构造
4.1 Command Center简介
4.2 搭建Command Center开发环境
4.3 模型集成到Command Center中
4.3.1 编译Tensor Flow
4.3.2 模型固化
4.3.3 改进Production Manager并实现Build Order Prediction
4.4 实验及分析
4.4.1 本地测试
4.4.2 Star Craft 2 AI Ladder测试
4.5 本章小结
总结与展望
致谢
参考文献
附录
攻读硕士学位期间发表的论文及参与的科研项目
【参考文献】:
期刊论文
[1]卷积神经网络的发展及其在计算机视觉领域中的应用综述[J]. 陈超,齐峰. 计算机科学. 2019(03)
[2]人工智能与“星际争霸”:多智能体博弈研究新进展[J]. 张宏达,李德才,何玉庆. 无人系统技术. 2019(01)
[3]深度强化学习进展:从AlphaGo到AlphaGo Zero[J]. 唐振韬,邵坤,赵冬斌,朱圆恒. 控制理论与应用. 2017(12)
[4]深度学习在语音识别中的研究进展综述[J]. 侯一民,周慧琼,王政一. 计算机应用研究. 2017(08)
本文编号:3638408
【文章来源】:西南交通大学四川省211工程院校教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 主要研究工作
1.4 论文组织结构
1.5 本章小结
第2章 基于SC2LE构建游戏特征数据集
2.1 SC2LE简介及搭建
2.1.1 星际争霸II客户端和SC2API
2.1.2 PySC2
2.1.3 游戏回放数据集
2.1.4 搭建SC2LE平台
2.2 构建游戏特征数据集
2.2.1 实验环境
2.2.2 预处理
2.2.3 解析游戏回放
2.2.4 特征提取
2.2.5 归一化
2.2.6 划分
2.3 本章小结
第3章 游戏智能体下一步生产动作的预测
3.1 基于多层感知机的下一步生产动作的预测
3.1.1 网络架构
3.1.2 网络实现细节
3.1.3 实验及分析
3.2 基于LSTM网络的下一步生产动作的预测
3.2.1 LSTM网络架构
3.2.2 LSTM网络实现
3.2.3 实验及分析
3.3 本章小结
第4章 智能体构造
4.1 Command Center简介
4.2 搭建Command Center开发环境
4.3 模型集成到Command Center中
4.3.1 编译Tensor Flow
4.3.2 模型固化
4.3.3 改进Production Manager并实现Build Order Prediction
4.4 实验及分析
4.4.1 本地测试
4.4.2 Star Craft 2 AI Ladder测试
4.5 本章小结
总结与展望
致谢
参考文献
附录
攻读硕士学位期间发表的论文及参与的科研项目
【参考文献】:
期刊论文
[1]卷积神经网络的发展及其在计算机视觉领域中的应用综述[J]. 陈超,齐峰. 计算机科学. 2019(03)
[2]人工智能与“星际争霸”:多智能体博弈研究新进展[J]. 张宏达,李德才,何玉庆. 无人系统技术. 2019(01)
[3]深度强化学习进展:从AlphaGo到AlphaGo Zero[J]. 唐振韬,邵坤,赵冬斌,朱圆恒. 控制理论与应用. 2017(12)
[4]深度学习在语音识别中的研究进展综述[J]. 侯一民,周慧琼,王政一. 计算机应用研究. 2017(08)
本文编号:3638408
本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/3638408.html