基于点格棋的博弈算法研究与改进
本文选题:机器博弈 切入点:评估函数 出处:《中国矿业大学》2017年硕士论文 论文类型:学位论文
【摘要】:人工智能是计算机科学的一个分支,目的是使机器能够像人类智能一样感知环境并最大化达到目标的可能。机器博弈是人工智能极具挑战的分支之一,其研究对人工智能的发展具有积极的作用。国外在机器博弈方面的研究较早,并取得了一定的成就;国内的研究相对滞后。以棋类为载体是目前机器博弈的主要研究方法。机器博弈系统可以分为四部分:局面表示、行动集合、评估函数和博弈树搜索,其中前两者相对简单。本文以点格棋为载体,着重对评估函数和博弈树搜索算法进行了研究。在评估函数方面,分析了影响点格棋棋局评价的因素,设计了一个带参数的评估函数。采用遗传算法对参数进行优化。为了加快收敛速度,加入启发式信息指导搜索的进行,引入适应度矩阵、交叉变异率矩阵,对染色体中的每个参数进行分别考虑。为了减少训练时间,提出一种梯度训练方案。最后通过实验对以上方案进行验证分析,实验结果表明,参数优化后的点格棋棋力得到提升,梯度训练方案有效减少了训练时间。在博弈树搜索方面,对经典的博弈树搜索算法进行了研究。对算法的思路及其改进措施进行了分析,通过实验对比统计了不同搜索算法搜索的节点数和时间开销,同时也指出了其不足之处,这些不足往往是其他搜索算法优化的基础。本文还介绍了几个优化策略,分析了其优化思路,通过实验对其优化效果进行了验证。传统博弈树搜索算法进行等深度搜索使得时间资源得不到合理分配从而导致效率低下,为此本文提出离散度的概念,以此作为判断标准对不同的局面进行不同深度的搜索;针对历史启发算法可能出现不准确的情况以及迭代加深算法效率低的问题,本文提出HT-IT算法,综合了历史启发与迭代加深的优点,使搜索效率得到提升;将博弈树搜索算法与并行、分布式相结合,研究了基于PVM的并行博弈树搜索算法,提供了一种新的改进方向。最后通过实验对以上改进策略进行了对比验证,结果表明与其他算法相比变长搜索方案和HT-IT算法减少了搜索节点数,并行博弈树搜索算法则有效缩短了搜索时间。
[Abstract]:Artificial intelligence is a branch of computer science designed to enable machines to perceive the environment as human intelligence and maximize the possibility of achieving its goals. Machine game is one of the most challenging branches of artificial intelligence. Its research has positive effect on the development of artificial intelligence. At present, the machine game system can be divided into four parts: situation representation, action set, evaluation function and game tree search. The first two are relatively simple. In this paper, the evaluation function and the game tree search algorithm are studied. In the evaluation function, the factors that affect the evaluation of the game are analyzed. An evaluation function with parameters is designed. Genetic algorithm is used to optimize the parameters. In order to speed up the convergence, heuristic information is added to guide the search. The fitness matrix and the cross-mutation rate matrix are introduced. In order to reduce the training time, a gradient training scheme is proposed. Finally, the experimental results show that, After the optimization of parameters, the strength of grid chess is improved, and the training time is effectively reduced by the gradient training scheme. In the aspect of game tree search, the classical game tree search algorithm is studied. The train of thought of the algorithm and its improvement measures are analyzed. The number of nodes and the time cost of different search algorithms are compared through experiments. At the same time, the shortcomings are pointed out, which are often the basis of the optimization of other search algorithms. Several optimization strategies are also introduced in this paper. The optimization idea is analyzed, and its optimization effect is verified by experiments. The traditional game tree search algorithm for equal depth search results in inefficiency due to the lack of reasonable allocation of time resources. In this paper, the concept of discreteness is proposed in this paper. In order to solve the problem of inaccuracy of historical heuristic algorithm and low efficiency of iterative deepening algorithm, HT-IT algorithm is proposed in this paper. The search efficiency is improved by synthesizing the advantages of historical inspiration and iterative deepening, and the parallel game tree search algorithm based on PVM is studied by combining game tree search algorithm with parallel and distributed search algorithm. A new direction of improvement is provided. Finally, the experimental results show that the variable length search scheme and the HT-IT algorithm reduce the number of search nodes compared with other algorithms. The parallel game tree search algorithm effectively shortens the search time.
【学位授予单位】:中国矿业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP18
【参考文献】
相关期刊论文 前10条
1 陶九阳;吴琳;胡晓峰;;AlphaGo技术原理分析及人工智能军事应用展望[J];指挥与控制学报;2016年02期
2 卢俊;张保明;郭海涛;陈小卫;;利用并查集的多视匹配点提取算法[J];计算机应用;2016年06期
3 贺倩;;人工智能技术发展研究[J];现代电信科技;2016年02期
4 刘明;王瑞;;基于自适应遗传算法的改进PID参数优化[J];计算机测量与控制;2015年03期
5 蔡自兴;;人工智能在冶金自动化中的应用[J];冶金自动化;2015年01期
6 王弈;李传富;;人工智能方法在医学图像处理中的研究新进展[J];中国医学物理学杂志;2013年03期
7 程宇;雷小锋;;五子棋中Alpha-Beta搜索算法的研究与改进[J];计算机工程;2012年17期
8 张明亮;吴俊;李凡长;;五子棋机器博弈系统评估函数的设计[J];计算机应用;2012年07期
9 邹蕾;张先锋;;人工智能及其发展应用[J];信息网络安全;2012年02期
10 焦尚彬;刘丁;;博弈树置换表启发式算法研究[J];计算机工程与应用;2010年06期
相关博士学位论文 前2条
1 夏小云;随机启发式搜索算法的性能分析[D];华南理工大学;2015年
2 宫良伟;基于AutoCAD Map 3D的通风仿真系统的研究[D];中国矿业大学;2012年
相关硕士学位论文 前10条
1 刘洋;点格棋博弈中UCT算法的研究与实现[D];安徽大学;2016年
2 唐霜霜;点格棋机器博弈系统的研究与实现[D];安徽大学;2015年
3 黄春;改进遗传算法的函数优化及应用[D];广西大学;2015年
4 褚秋雯;从哲学的角度看人工智能[D];武汉理工大学;2014年
5 宋兴亮;中国象棋博弈树搜索算法研究与实现[D];沈阳工业大学;2012年
6 杨旭;基于动态博弈的入侵响应决策模型[D];吉林大学;2011年
7 连莲;基于Moore自动机的机器博弈系统建模与研究[D];东北大学;2009年
8 张明亮;一种新的博弈树搜索算法及其应用研究[D];苏州大学;2007年
9 高强;一种混合博弈树算法在中国象棋人机博弈中的应用研究[D];大连交通大学;2007年
10 张雪琼;基于博弈论的入侵检测系统[D];华中科技大学;2006年
,本文编号:1561647
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1561647.html