五子棋人机博弈算法优化研究与实现
发布时间:2020-12-12 19:14
计算机博弈,也称机器博弈,是博弈论与计算机技术结合的产物,是人工智能领域的一个重要研究方向,同时也是兵棋推演、机器智能、智能决策系统等众多人工智能应用领域的研究基础和实验田,长期以来一直受到国内外学者的广泛关注。近年来,随着以各类深度学习算法为代表的人工智能技术研究的日益深入,尤其以AlphaGo为代表的机器博弈系统取得的巨大成功,进一步推动了机器博弈理论与相关技术的快速发展。近代机器博弈研究主要以围棋、象棋、五子棋等棋类人机博弈为主。其中,国际象棋的计算机博弈研究历史最为悠久,并且经历了一场波澜壮阔的“搏杀”,尤其“深蓝”计算机的胜利不仅给人类留下了深刻印象,同时总结出一套关于国际象棋机器博弈的过程建模、状态表示、着法生成、棋局评估、博弈树搜索、开局库与残局库开发、系统测试与参数优化等核心技术要点,为后续相关研究确定了研究方向。鉴于五子棋作为生活中最为普及的棋类之一,具有规则简单易懂和典型零和完备信息博弈的所有特点,便于开展深入研究和快速评估博弈算法的优劣,为此本文以五子棋博弈为研究对象,针对零和完备信息博弈问题开展了博弈树搜索算法优化和系统自学习能力训练等方面的相关研究,主要研究内...
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
图1」技术路线图??Fig.?1.1?The?technology?roadmap??1.4论文组织结构??
及计算,使机器能够像人脑一样,实现对各类数据的学习、分类和识别。为了模拟细胞??结构,模型中设置了权值来实现调整神经元之间的连接程度,通过一层层的计算处理实??现了信息的传递。人工神经网络根据模型内部的架构层次和激励函数的不同,网络的输??出也会有所不同。关于人工神经网络的重要概念和模型算法分述如下。??3.1.1感知机模型??感知机模型在1958年被提出用于模拟神经元的内部结构,最初的结构只有简单的??两层神经元,输入层接受模型的输入信息,通过内部结构的权值运算后再经过激活函数??得到最终的输出值[29]。??感知机其类型属于标准的二分类模型,模型的输入是样本的特征,输出是样本的类??型,其结构如图3.1所示。??
?五子棋人机博弈算法优化研宄与实现???/(x)?=?max(0,x)?(3.4)??函数图像如图3.3所示:??ReLU函数??6.5?:??5.5?/??/??35??2.5??15????.?0-5?/?'??-6?-4?-2?-0.5?0?2?4?6??‘图3.3?ReLU函数图像??Fig.?3.3?ReLU?Function?Image??由函数图像看出,当输入值小于等于0时,则输出0;当输入大于0时,则输出??_y?=?x。相比较于上面两个函数,ReLU函数在第一象限中,斜率保持不变,整体呈持上??升状态,该分段公式中只存在线性公式,而其它的两个函数都需要指数运算,这样计算??速度就会快很多。??ReLU函数的缺点也很明显,当输入是负数时,函数的值一直为0,也就是说一旦??输入的是负数,激活函数就会失效。在模型训练中调整梯度也就会为零,并且该函数函??数的输出不是原点对称的,在训练调整的过程中效率低下,后期的优化也会变得十分困??难。??针对上述存在的问题,有学者提出了?Leaky?ReLU函数来解决神经元无效的问题,??将该函数直接分为两段,与ReLU不同地方在于当输入值小于0时,不再是直接归0,??而是取一个斜率较小的线性函数具体见公式(3.5):??fjv,?X?^?0??Leaky:〇:〇:)二j?”?(3.5)??[ox,x<?0??类似的还有公式(3.6)的Softplus函数,也是在ReLU函数的基础改进得到的:??Softplus:汉(x)?=?log(l?+?ev)?(3.6)??-20?-??
【参考文献】:
期刊论文
[1]爱恩斯坦棋计算机博弈算法研究与改进[J]. 杨昌杰,陈柯成,刘跃元,王京. 无线互联科技. 2018(15)
[2]计算机博弈的研究与发展[J]. 王亚杰,邱虹坤,吴燕燕,李飞,杨周凤. 智能系统学报. 2016(06)
[3]六子棋中基于局部“路”扫描方式的博弈树生成算法[J]. 李学俊,王小龙,吴蕾,刘慧婷. 智能系统学报. 2015(02)
[4]爱恩斯坦棋静态攻防策略的研究[J]. 周文敏,李淑琴. 电脑知识与技术. 2014(05)
[5]爱恩斯坦棋算法设计与分析[J]. 李占宇,李淑琴,顾磊,史玉峰,周文敏. 信息技术与信息化. 2014(01)
[6]苏拉卡尔塔博弈系统中评估函数的研究[J]. 李淑琴,李静波,韩裕华,陶思拓. 北京信息科技大学学报(自然科学版). 2012(06)
[7]UCT算法在计算机围棋中的应用与改进[J]. 周明明,高航,赵国安. 数据采集与处理. 2012(S2)
[8]计算机博弈中估值算法与博弈训练的研究[J]. 吕艳辉,宫瑞敏. 计算机工程. 2012(11)
[9]一种改进的基于博弈树模型的五子棋系统[J]. 杨云强,吴姣. 科学技术与工程. 2012(05)
[10]一类非完备信息博弈的信息模型[J]. 马骁,王轩,王晓龙. 计算机研究与发展. 2010(12)
博士论文
[1]计算机博弈问题的复杂性、理论解及相关搜索算法研究[D]. 高强.东北大学 2016
[2]模糊神经网络学习算法及收敛性研究[D]. 李龙.大连理工大学 2010
硕士论文
[1]基于卷积神经网络的射线图像识别系统的研究[D]. 李玉.北华航天工业学院 2019
[2]基于卷积神经网络的表情识别研究[D]. 陈航.南京邮电大学 2018
[3]基于卷积神经网络的苹果表面伤疤识别研究[D]. 高友文.南京邮电大学 2018
[4]国际跳棋完备信息博弈关键技术研究与系统设计[D]. 杨周凤.沈阳航空航天大学 2018
[5]双人博弈问题中的蒙特卡洛树搜索算法的改进[D]. 季辉.中国科学技术大学 2017
[6]五子棋计算机博弈系统的研究与设计[D]. 张效见.安徽大学 2017
[7]基于Alpha-Beta剪枝算法的黑白棋游戏的设计与开发[D]. 王增财.内蒙古大学 2016
[8]基于BP神经网络的五子棋自学习系统的设计与实现[D]. 陈桥.燕山大学 2016
[9]六子棋博弈中搜索技术的研究与实现[D]. 汪坤兵.安徽大学 2016
[10]爱恩斯坦棋计算机博弈系统的研究与实现[D]. 光洋.安徽大学 2016
本文编号:2913127
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
图1」技术路线图??Fig.?1.1?The?technology?roadmap??1.4论文组织结构??
及计算,使机器能够像人脑一样,实现对各类数据的学习、分类和识别。为了模拟细胞??结构,模型中设置了权值来实现调整神经元之间的连接程度,通过一层层的计算处理实??现了信息的传递。人工神经网络根据模型内部的架构层次和激励函数的不同,网络的输??出也会有所不同。关于人工神经网络的重要概念和模型算法分述如下。??3.1.1感知机模型??感知机模型在1958年被提出用于模拟神经元的内部结构,最初的结构只有简单的??两层神经元,输入层接受模型的输入信息,通过内部结构的权值运算后再经过激活函数??得到最终的输出值[29]。??感知机其类型属于标准的二分类模型,模型的输入是样本的特征,输出是样本的类??型,其结构如图3.1所示。??
?五子棋人机博弈算法优化研宄与实现???/(x)?=?max(0,x)?(3.4)??函数图像如图3.3所示:??ReLU函数??6.5?:??5.5?/??/??35??2.5??15????.?0-5?/?'??-6?-4?-2?-0.5?0?2?4?6??‘图3.3?ReLU函数图像??Fig.?3.3?ReLU?Function?Image??由函数图像看出,当输入值小于等于0时,则输出0;当输入大于0时,则输出??_y?=?x。相比较于上面两个函数,ReLU函数在第一象限中,斜率保持不变,整体呈持上??升状态,该分段公式中只存在线性公式,而其它的两个函数都需要指数运算,这样计算??速度就会快很多。??ReLU函数的缺点也很明显,当输入是负数时,函数的值一直为0,也就是说一旦??输入的是负数,激活函数就会失效。在模型训练中调整梯度也就会为零,并且该函数函??数的输出不是原点对称的,在训练调整的过程中效率低下,后期的优化也会变得十分困??难。??针对上述存在的问题,有学者提出了?Leaky?ReLU函数来解决神经元无效的问题,??将该函数直接分为两段,与ReLU不同地方在于当输入值小于0时,不再是直接归0,??而是取一个斜率较小的线性函数具体见公式(3.5):??fjv,?X?^?0??Leaky:〇:〇:)二j?”?(3.5)??[ox,x<?0??类似的还有公式(3.6)的Softplus函数,也是在ReLU函数的基础改进得到的:??Softplus:汉(x)?=?log(l?+?ev)?(3.6)??-20?-??
【参考文献】:
期刊论文
[1]爱恩斯坦棋计算机博弈算法研究与改进[J]. 杨昌杰,陈柯成,刘跃元,王京. 无线互联科技. 2018(15)
[2]计算机博弈的研究与发展[J]. 王亚杰,邱虹坤,吴燕燕,李飞,杨周凤. 智能系统学报. 2016(06)
[3]六子棋中基于局部“路”扫描方式的博弈树生成算法[J]. 李学俊,王小龙,吴蕾,刘慧婷. 智能系统学报. 2015(02)
[4]爱恩斯坦棋静态攻防策略的研究[J]. 周文敏,李淑琴. 电脑知识与技术. 2014(05)
[5]爱恩斯坦棋算法设计与分析[J]. 李占宇,李淑琴,顾磊,史玉峰,周文敏. 信息技术与信息化. 2014(01)
[6]苏拉卡尔塔博弈系统中评估函数的研究[J]. 李淑琴,李静波,韩裕华,陶思拓. 北京信息科技大学学报(自然科学版). 2012(06)
[7]UCT算法在计算机围棋中的应用与改进[J]. 周明明,高航,赵国安. 数据采集与处理. 2012(S2)
[8]计算机博弈中估值算法与博弈训练的研究[J]. 吕艳辉,宫瑞敏. 计算机工程. 2012(11)
[9]一种改进的基于博弈树模型的五子棋系统[J]. 杨云强,吴姣. 科学技术与工程. 2012(05)
[10]一类非完备信息博弈的信息模型[J]. 马骁,王轩,王晓龙. 计算机研究与发展. 2010(12)
博士论文
[1]计算机博弈问题的复杂性、理论解及相关搜索算法研究[D]. 高强.东北大学 2016
[2]模糊神经网络学习算法及收敛性研究[D]. 李龙.大连理工大学 2010
硕士论文
[1]基于卷积神经网络的射线图像识别系统的研究[D]. 李玉.北华航天工业学院 2019
[2]基于卷积神经网络的表情识别研究[D]. 陈航.南京邮电大学 2018
[3]基于卷积神经网络的苹果表面伤疤识别研究[D]. 高友文.南京邮电大学 2018
[4]国际跳棋完备信息博弈关键技术研究与系统设计[D]. 杨周凤.沈阳航空航天大学 2018
[5]双人博弈问题中的蒙特卡洛树搜索算法的改进[D]. 季辉.中国科学技术大学 2017
[6]五子棋计算机博弈系统的研究与设计[D]. 张效见.安徽大学 2017
[7]基于Alpha-Beta剪枝算法的黑白棋游戏的设计与开发[D]. 王增财.内蒙古大学 2016
[8]基于BP神经网络的五子棋自学习系统的设计与实现[D]. 陈桥.燕山大学 2016
[9]六子棋博弈中搜索技术的研究与实现[D]. 汪坤兵.安徽大学 2016
[10]爱恩斯坦棋计算机博弈系统的研究与实现[D]. 光洋.安徽大学 2016
本文编号:2913127
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2913127.html