一种自学习的智能五子棋算法的设计与实现
发布时间:2021-06-03 18:20
强化学习长期以来的一个目标是创造一个能够在具有挑战性的领域,以超越人类的精通程度学习的算法.基于蒙特卡洛树搜索与深度神经网络设计一种自学习智能五子棋算法,无需人类知识,从零开始学习.其中深度神经网络是由32个卷积层组成的深度残差网络;蒙特卡洛树搜索可根据多次模拟博弈的结果预测最优的移动方案.将五子棋规则与蒙特卡洛树搜索和深度神经网络相结合,蒙特卡洛树搜索使用深度神经网络评估落子位置和选择移动,增强树的搜索强度,提高落子质量,优化自对弈迭代.通过蒙特卡洛树搜索进行自对弈,训练一个神经网络来预测落子选择以及游戏的赢家.经过两天的训练,该算法的埃洛等级分已经达到4000分,远远高于普通人类水平.
【文章来源】:小型微型计算机系统. 2020,41(06)北大核心CSCD
【文章页数】:7 页
【部分图文】:
蒙特卡洛树搜索流程示例
深度残差网络模型图
棋盘数据处理
【参考文献】:
期刊论文
[1]随机多选择残差网络集成的遥感图像分类算法[J]. 周强,徐宏伟,陈逸,孙玉宝. 小型微型计算机系统. 2019(09)
[2]基于α-β剪枝树算法的安卓五子棋程序设计与实现[J]. 宋万洋. 现代信息科技. 2019(11)
[3]五子棋人工智能算法实现研究[J]. 孙世文. 中国新通信. 2018(23)
[4]基于深度强化学习的流媒体边缘云会话调度策略[J]. 徐西建,王子磊,奚宏生. 计算机工程. 2019(05)
硕士论文
[1]五子棋人工智能算法设计与实现[D]. 刘瑞.华南理工大学 2012
本文编号:3211009
【文章来源】:小型微型计算机系统. 2020,41(06)北大核心CSCD
【文章页数】:7 页
【部分图文】:
蒙特卡洛树搜索流程示例
深度残差网络模型图
棋盘数据处理
【参考文献】:
期刊论文
[1]随机多选择残差网络集成的遥感图像分类算法[J]. 周强,徐宏伟,陈逸,孙玉宝. 小型微型计算机系统. 2019(09)
[2]基于α-β剪枝树算法的安卓五子棋程序设计与实现[J]. 宋万洋. 现代信息科技. 2019(11)
[3]五子棋人工智能算法实现研究[J]. 孙世文. 中国新通信. 2018(23)
[4]基于深度强化学习的流媒体边缘云会话调度策略[J]. 徐西建,王子磊,奚宏生. 计算机工程. 2019(05)
硕士论文
[1]五子棋人工智能算法设计与实现[D]. 刘瑞.华南理工大学 2012
本文编号:3211009
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3211009.html