当前位置:主页 > 科技论文 > AI论文 >

基于蒙特卡洛树搜索的计算机围棋博弈研究

发布时间:2016-11-17 06:21

  本文关键词:基于蒙特卡洛树搜索的计算机围棋博弈研究,由笔耕文化传播整理发布。


《大连海事大学》 2015年

基于蒙特卡洛树搜索的计算机围棋博弈研究

于永波  

【摘要】:近年来,计算机软硬件和互联网迅猛发展,相关学科也在不断进步。人工智能是长期以来的热点话题,而计算机博弈是它的一个受到广泛关注的研究方向。作为最复杂的博弈项目之一,具有挑战性的围棋能够充分检验人工智能的发展水平,因此计算机围棋博弈的研究在计算机博弈、人工智能乃至计算机科学领域占有重要的地位。由于围棋知识规则不便归纳,搜索空间过于巨大,传统计算机博弈的理论和方法目前均难以适用。近些年,在计算机性能大幅度提高的基础上,计算机围棋博弈采用蒙特卡洛方法进行动态评估,并引入了上限信心界应用树算法,搜索的效率和评估的性能均得到了很大提升,计算机围棋博弈程序的水平不断提高。同时,这种聚类智能的计算方法不仅适用于围棋,还适用于规划决策类问题等其他许多问题,因此计算机围棋博弈方面的研究成果有着重要的现实意义,可以有更广阔的用武之地。由蒙特卡洛方法和上限信心界应用树算法构成的蒙特卡洛树搜索是当今高水平计算机围棋程序普遍采用的较优方法,但其仍有可完善之处。本文立足于蒙特卡洛树搜索的思想和特点,针对蒙特卡洛方法和上限信心界应用树算法存在的不足,提出了绝对剪枝策略和渐进展开策略两大改进措施,并从理论上证明了改进的必要性和正确性。而后,本文选用了采用蒙特卡洛树搜索的棋力很强的开源围棋程序Fuego作为改进试验程序,通过GoGui平台使其改进前和改进后分别与另一高水平程序Pachi对弈,根据对局的用时和胜负进行验证和分析。实验结果表明,Fuego在用时略有下降的情况下胜率有所提高,这说明改进方案切实有效,具备一定的实用价值。

【关键词】:
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP18
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【参考文献】

中国期刊全文数据库 前4条

1 李德毅;肖俐平;;网络时代的人工智能[J];中文信息学报;2008年02期

2 邓超;吴霖;陈磊;袁梅宇;;局部UCT算法在围棋死活题上的性能测试[J];信息技术;2013年03期

3 王岩;尹海丽;窦在祥;;蒙特卡罗方法应用研究[J];青岛理工大学学报;2006年02期

4 周明明;高航;赵国安;;UCT算法在计算机围棋中的应用与改进[J];数据采集与处理;2012年S2期

中国博士学位论文全文数据库 前1条

1 岳鹏;计算机围棋中的算法研究[D];西南大学;2007年

中国硕士学位论文全文数据库 前2条

1 黄晶;计算机围棋博弈中UCT算法的应用及改进[D];北京邮电大学;2011年

2 郭洁;围棋人工智能中几个上限值的研究[D];中南大学;2013年

【共引文献】

中国期刊全文数据库 前10条

1 来水利;颜珩烨;朱雷;;RSM法优化微波场下壳聚糖降解[J];北京工商大学学报(自然科学版);2008年03期

2 侯大志;贺晓玲;张孝双;蒋洪晖;;基于蒙特卡罗仿真的多种二进制通信系统性能分析[J];电子设计工程;2012年06期

3 鲁靖;卞树檀;周帅;;基于蒙特卡罗仿真与逆向FTF的复杂系统可靠性分析[J];电子器件;2014年02期

4 张立嘉;茆家旭;;人工智能在下一代广播电视网中的应用[J];广播电视信息;2015年07期

5 余丽丽;李仲谨;朱雷;宋凉;;应用响应曲面法优化N,N′-亚甲基双丙烯酰胺交联淀粉微球的合成工艺[J];化工进展;2008年03期

6 李仲谨;朱雷;余丽丽;宋凉;肖昊江;邱辉;;应用响应曲面优化交联淀粉微球的合成工艺[J];化学工程;2009年01期

7 利珊;;不确定性中的随机性和模糊性[J];金华职业技术学院学报;2010年03期

8 黄克平;应浩;黄婷;张亚;;蒙特卡罗算法在室内三维实时定位系统的应用[J];计量与测试技术;2008年09期

9 张兰江;张建福;;蒙特卡罗模拟法在排队论中的应用[J];交通与运输;2008年02期

10 柳高洁;顾克秋;;结合NSGA-Ⅱ算法和蒙特卡罗模拟技术实现结构的鲁棒优化[J];机械设计;2009年04期

中国重要会议论文全文数据库 前1条

1 Li Fei;Ouyang Li;Wang Yajie;Dong Yanqiu;;Study of Strategy Selection Based on Phantom Go[A];第26届中国控制与决策会议论文集[C];2014年

中国博士学位论文全文数据库 前9条

1 揣媛媛;空间信息网格环境下的矿产资源证据权评价方法研究[D];吉林大学;2007年

2 冯国双;中国癌症高发现场评价与质量控制[D];北京大学;2008年

3 孙刚;限制性克立格法在矿产资源储量估算中的应用[D];吉林大学;2008年

4 杨鹏;船舶六自由度运动模拟台及其控制方法研究[D];哈尔滨工程大学;2008年

5 赵丕杰;LOD在直扩系统微弱信号检测中的应用与研究[D];哈尔滨工程大学;2009年

6 张勤;浮法玻璃成形中传热与渗锡的数值模拟[D];清华大学;2011年

7 王富强;空间知识地图构建理论和方法研究[D];解放军信息工程大学;2013年

8 邓文红;基于知识管理的办公系统智能化研究[D];西南交通大学;2014年

9 龚谊承;基于频率类别的洪水过程模拟和广义洪水风险分析与模拟[D];武汉大学;2012年

中国硕士学位论文全文数据库 前10条

1 曹庆安;基于RS与GIS的安福县基本农田保护区划定研究[D];江西师范大学;2010年

2 王刚;生物科学视角下的类生命体生态设计[D];江南大学;2011年

3 黄晶;计算机围棋博弈中UCT算法的应用及改进[D];北京邮电大学;2011年

4 王树波;基于抽样模拟技术的有色冶金配料过程优化方法研究[D];中南大学;2011年

5 郭佳;多股流换热器通道排列优化设计研究[D];上海理工大学;2009年

6 常乐;长白山典型地区降雨分布型及洪涝灾害预测研究[D];东北师范大学;2011年

7 李晶影;考虑局部应力集中的机械零部件可靠性灵敏度分析[D];吉林大学;2007年

8 李辉山;工程项目进度—费用协调控制的仿真实现研究[D];西安建筑科技大学;2007年

9 陈英;基于季节模型的通信话务量预测的研究与实施[D];北京邮电大学;2007年

10 牟磊;基于GIS和CA模型的土地利用变化研究[D];新疆大学;2007年

【二级参考文献】

中国期刊全文数据库 前10条

1 沈傲东;罗立民;;基于蒙特卡罗积分的数字影像重建方法[J];东南大学学报(自然科学版);2008年06期

2 张振;顾治华;;机器博弈及其搜索算法的研究[J];电脑知识与技术;2008年24期

3 徐东升;周伟华;;基于马尔科夫决策过程的货物流的配给策略[J];管理工程学报;2009年04期

4 余磊;刘锦高;;一种围棋中盘问题的计算机求解方法[J];华东师范大学学报(自然科学版);2008年01期

5 李德毅;刘坤;孙岩;韩明畅;;涌现计算:从无序掌声到有序掌声的虚拟现实[J];中国科学(E辑:信息科学);2007年10期

6 孙舒杨;刘大有;孙成敏;;二人博弈问题中单一纳什均衡的搜索算法[J];吉林大学学报(理学版);2006年03期

7 谷蓉,刘学民,朱仲涛,周杰;一种围棋定式的机器学习方法[J];计算机工程;2004年06期

8 廖里;围棋死活问题的计算机求解[J];计算机应用;2005年11期

9 李德毅;肖俐平;;网络时代的人工智能[J];中文信息学报;2008年02期

10 王鲁明,戴汝为;在计算机围棋中形象思维的研究[J];自动化学报;1997年04期

中国硕士学位论文全文数据库 前2条

1 黄晶;计算机围棋博弈中UCT算法的应用及改进[D];北京邮电大学;2011年

2 陈磊;计算机围棋领域概念网的设计与实现[D];北京邮电大学;2010年

【相似文献】

中国期刊全文数据库 前10条

1 元丁;;令人惊讶的张冠李戴[J];新闻战线;1992年09期

2 张文明;工作站环境中电路的蒙特卡洛分析[J];计算机应用研究;1997年02期

3 程康萱;;忆访棋王卫冕战——蒙特卡洛琐记[J];新闻三昧;1995年03期

4 董宽;;再见,蒙特卡洛——访申办2000年奥运会决战纪实[J];新闻三昧;1994年01期

5 闵涛;张帆;;参数反演的微分进化蒙特卡洛算法[J];计算机工程与应用;2012年07期

6 葛丽萍;鄂英杰;;运用Crystal Ball & MS Project实现项目进度的蒙特卡洛风险分析[J];电脑编程技巧与维护;2013年08期

7 张建平;张凤莲;陶华;;基于混合蒙特卡洛算法的容差分配研究[J];计算机仿真;2009年10期

8 马北北;;蒙特卡洛:举世瞩目的一天[J];青年记者;1994年01期

9 曲洪权;庞丽萍;李运泽;;序列蒙特卡洛滤波在卫星传热反问题中的应用[J];系统仿真学报;2008年13期

10 钱键民;;雷达虚警概率模拟与重要采样技术[J];火控雷达技术;1984年02期

中国重要会议论文全文数据库 前3条

1 程磊;房永智;王刚;;蒙特卡洛计算方法与作战毁伤模拟决策分析[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年

2 周永宏;郑大伟;廖新浩;;相关分析显著水平的蒙特卡洛模拟检验[A];中国地球物理学会年刊2002——中国地球物理学会第十八届年会论文集[C];2002年

3 康晓岩;陈永义;;一种改进的蒙特卡洛选择算子[A];中国系统工程学会模糊数学与模糊系统委员会第十一届年会论文选集[C];2002年

中国重要报纸全文数据库 前6条

1 记者 王庆芳;[N];石家庄日报;2005年

2 梁丽娟;[N];人民日报海外版;2008年

3 宋志坚;[N];福建日报;2007年

4 阳映红 编译;[N];中国保险报;2014年

5 阳映红 编译;[N];中国保险报;2014年

6 李雨萌;[N];大连日报;2014年

中国硕士学位论文全文数据库 前7条

1 于永波;基于蒙特卡洛树搜索的计算机围棋博弈研究[D];大连海事大学;2015年

2 祁建娟;CDO信用风险度量的蒙特卡洛算法优化及应用[D];上海交通大学;2015年

3 邓斌;基于蒙特卡洛算法的锚泊容量研究[D];大连海事大学;2012年

4 徐麟;基于蒙特卡洛分析的港口项目财务风险研究[D];大连海事大学;2008年

5 谢东;基于蒙特卡洛技术的中国移动无线网优项目时间管理研究[D];安徽大学;2012年

6 夏勇;基于蒙特卡洛的动态无线传感器网络节点定位算法研究[D];辽宁科技大学;2014年

7 肖峰;GPU高性能运算在计算机围棋博弈系统中的应用研究及实验[D];北京邮电大学;2011年


  本文关键词:基于蒙特卡洛树搜索的计算机围棋博弈研究,由笔耕文化传播整理发布。



本文编号:178381

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/178381.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8d91d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com