当前位置:主页 > 管理论文 > 领导决策论文 >

德州扑克计算机博弈智能决策模型研究

发布时间:2021-06-20 07:35
  计算机博弈一直是人工智能最具挑战性的研究方向之一。它也称机器博弈,主要分为完全信息计算机博弈和不完全信息计算机博弈两大类型,其中,完全信息计算机博弈是指博弈各方在博弈状态、博弈进程完全透明下的博弈,而不完全信息计算机博弈是指博弈各方的博弈状态或过程信息不透明、或不完全透明下的博弈。论文中的德扑博弈就属于是非完全信息计算机博弈的一个实例,论文以它为应用研究对象,探讨人工智能技术在非完全信息博弈中的实际应用。机器学习是人工智能领域的一个研究热点,以谷歌阿尔法狗为代表的围棋博弈程序,表现出了强大对弈能力,围棋仅仅是双人完全信息博弈棋类游戏,而德扑属于两人或两人以上的非完全信息博弈牌类游戏,因此,如何对照围棋博弈方法将强化学习与神经网络相结合,并应用于非完全信息的德扑博弈中,是计算机博弈领域亟待解决的问题。特别是强化学习面对德扑博弈中信息不完全、高维状态空间、存在过估计问题、难以快速发现最优解,以及难收敛等问题,极大地影响了博弈程序的战力。论文针对上述问题,采用人工神经网络和强化学习相结合的方法,改进强化学习算法,改进卷积神经网络,研制德扑决策模型,最后验证决策模型达到预期效果。论文具体研究工... 

【文章来源】:重庆理工大学重庆市

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

德州扑克计算机博弈智能决策模型研究


筹码数量80表示方法

系统模块,搜索引擎,估值


5德扑博弈系统的实现435德扑博弈系统的实现5.1德扑博弈系统的构造5.1.1系统模块德扑博弈系统分为五个部分:博弈系统的表示方法、博弈系统的搜索引擎、博弈系统的博弈估值算法、博弈系统的规则解释器以及博弈系统可视化模块。如图5-1和如图5-2所示。图5-1德扑博弈系统模块图5-2德扑博弈系统界面

界面图,界面,系统模块,搜索引擎


5德扑博弈系统的实现435德扑博弈系统的实现5.1德扑博弈系统的构造5.1.1系统模块德扑博弈系统分为五个部分:博弈系统的表示方法、博弈系统的搜索引擎、博弈系统的博弈估值算法、博弈系统的规则解释器以及博弈系统可视化模块。如图5-1和如图5-2所示。图5-1德扑博弈系统模块图5-2德扑博弈系统界面

【参考文献】:
期刊论文
[1]深度学习应用技术研究[J]. 毛勇华,桂小林,李前,贺兴时.  计算机应用研究. 2016(11)
[2]阿法狗围棋系统的简要分析[J]. 田渊栋.  自动化学报. 2016(05)
[3]四国军棋游戏中搜索算法的实验与分析[J]. 陆慧,夏正友.  江南大学学报(自然科学版). 2007(06)
[4]棋牌游戏与事件对策[J]. 徐心和,郑新颖.  控制与决策. 2007(07)
[5]中国象棋计算机博弈关键技术分析[J]. 徐心和,王骄.  小型微型计算机系统. 2006(06)

硕士论文
[1]基于深度强化学习的3D游戏的非完备信息机器博弈研究[D]. 朱航宇.哈尔滨工业大学 2018
[2]计算机围棋博弈中UCT算法的应用及改进[D]. 黄晶.北京邮电大学 2011



本文编号:3238768

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3238768.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ad31f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com