棋盘局面数据标定方法研究
发布时间:2021-12-29 07:20
基于深度学习模型的有监督训练依赖于大量高质量标定数据,但众多小众计算机博弈比赛棋种存在缺少人类对局记录作为训练样本的问题,因此在使用深度学习模型前如何生成一个合理标定的局面数据集是值得研究探讨的问题。针对点格棋博弈问题,提出了一种数据哈希去重以及局面标定方法。根据不同阶段回合局面数据的特点,通过alpha-beta完全搜索、回溯标定、并行化MCTS算法标定以及对称扩展技巧,收集并标定不同回合数的点格棋局面样本。实验共获得了包含15 000 000个带标定点格棋局面样本的数据集,为基于深度学习模型的点格棋有监督训练提供了保障。此外,所提方法也为其他棋种训练数据的获取提供了有价值的借鉴。
【文章来源】: 计算机应用研究. 2020,37(02)北大核心CSCD
【文章页数】:3 页
【文章目录】:
1 点格棋局面表示及哈希去重法
2 数据标定方法的设计与实现
2.1 完全搜索数据标定法
2.2 回溯数据标定法
2.3 并行MCTS数据标定法
2.4 对称翻转扩充数据法
3 实验
3.1 搜索标注实例
3.2 回溯标注实例
3.3 对称翻转扩充实例
4 结束语
【参考文献】:
期刊论文
[1]计算机博弈竞赛与创新人才培养模式改革 [J]. 王亚杰,邱虹坤,尹航,徐晗,张洁. 实验技术与管理. 2016(10)
本文编号:3555662
【文章来源】: 计算机应用研究. 2020,37(02)北大核心CSCD
【文章页数】:3 页
【文章目录】:
1 点格棋局面表示及哈希去重法
2 数据标定方法的设计与实现
2.1 完全搜索数据标定法
2.2 回溯数据标定法
2.3 并行MCTS数据标定法
2.4 对称翻转扩充数据法
3 实验
3.1 搜索标注实例
3.2 回溯标注实例
3.3 对称翻转扩充实例
4 结束语
【参考文献】:
期刊论文
[1]计算机博弈竞赛与创新人才培养模式改革 [J]. 王亚杰,邱虹坤,尹航,徐晗,张洁. 实验技术与管理. 2016(10)
本文编号:3555662
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3555662.html