中国象棋计算机博弈中搜索算法的研究与改进

发布时间：2016-10-26 17:49

本文关键词：机器自学习博弈策略研究与实现，由笔耕文化传播整理发布。

《河北大学》 2010年

郭秀丽

【摘要】： 在人工智能领域,机器博弈始终是一个重要的组成部分。自从计算机问世以来,人们为了让计算机具有与人类棋手一样的博弈能力,进行了大量的研究和实验。机器棋手和人类棋手之间也展开了长达几十年的竞赛。其中最广为人知的要数“深蓝”在国际象棋上所取得的成就。“深蓝”的成功标志着计算机棋手战胜人类顶级大师已经从梦想变成了现实。而中国象棋的计算机博弈研究比国际象棋要落后三、四十年。虽然起步晚,但也取得了一定的成绩,出现了一大批具有高水平的象棋程序。本文针对中国象棋博弈系统进行研究,介绍了中国象棋计算机博弈的关键技术,总结并比较了不同的搜索算法、搜索策略在实战中的不同效果,分析了评估函数和辅助搜索机制在系统中所起的作用,并在研究的基础上实现了基于最佳优先搜索策略的算法,设计并改进了符合此算法的评估函数,使系统能够达到一定的实战水平。实验结果表明这种改进的评估函数对于最佳优先搜索的算法而言是有效的。

【关键词】：
【学位授予单位】：河北大学
【学位级别】：硕士
【学位授予年份】：2010
【分类号】：O225
【目录】：

摘要5-6

Abstract6-9

第1章绪论9-13

1.1 研究背景9-10

1.2 中国象棋机器博弈研究的发展状况10-12

1.3 中国象棋机器博弈简介12

1.4 本文结构12-13

第2章数据结构与表示13-19

2.1 棋盘结构13-14

2.2 棋子表示14-15

2.3 着法生成15-17

2.4 局面存储17-18

2.5 本章小结18-19

第3章中国象棋的评估函数19-25

3.1 经验评估函数19-22

3.1.1 棋子本身价值19-20

3.1.2 棋子位置附加值20

3.1.3 棋子相互作用值20-21

3.1.4 经验函数的一般形式21-22

3.2 实验评估函数22-23

3.3 自学习评估函数23-24

3.4 本章小结24-25

第4章经典搜索算法25-36

4.1 基础的极大极小算法25-27

4.2 alpha-beta剪枝算法27-29

4.3 小窗口搜索29-31

4.3.1 渴望搜索29-30

4.3.2 最小窗口搜索30-31

4.4 克服水平效应31-33

4.5 充分利用经验知识33-34

4.5.1 置换表法33

4.5.2 历史表法和着法排序33-34

4.6 实验结果34-36

第5章基于最佳优先的搜索方法36-44

5.1 SSS*与A*搜索36-37

5.2 分支定界搜索37

5.3 B*算法37-41

5.4 应用新的评估函数41-44

第6章结束语44-46

参考文献46-48

致谢48-49

攻读硕士学位期间科研工作情况49-50

下载全文更多同类文献

CAJ全文下载

(如何获取全文？欢迎：购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式

【参考文献】

中国期刊全文数据库前4条

1 王骄,王涛,罗艳红,徐心和;中国象棋计算机博弈系统评估函数的自适应遗传算法实现[J];东北大学学报(自然科学版);2005年10期

2 马占欣;李亚;陆玉昌;;用遗传算法解决博弈问题[J];河南科学;2007年02期

3 魏钦刚;王骄;徐心和;南晓斐;;中国象棋计算机博弈开局库研究与设计[J];智能系统学报;2007年01期

4 徐心和;王骄;;中国象棋计算机博弈关键技术分析[J];小型微型计算机系统;2006年06期

中国硕士学位论文全文数据库前3条

1 莫建文;机器自学习博弈策略研究与实现[D];广西师范大学;2002年

2 付强;基于激励学习的中国象棋研究[D];长沙理工大学;2006年

3 危春波;中国象棋博弈系统的研究与实现[D];昆明理工大学;2008年

【共引文献】

中国期刊全文数据库前10条

1 李春贵,吴沧浦,刘永信;一种集成规划的SARSA(λ)强化学习算法[J];北京理工大学学报;2002年03期

2 林海,孙吉贵;预测及其主要模型的实现系统[J];吉林大学学报(信息科学版);2002年04期

3 王晓鹏;王骄;徐心和;郑新颖;;中国象棋与国际象棋比较分析[J];重庆工学院学报(自然科学版);2007年01期

4 王骄,王涛,罗艳红,徐心和;中国象棋计算机博弈系统评估函数的自适应遗传算法实现[J];东北大学学报(自然科学版);2005年10期

5 吕志来,张保会,哈恒旭;一种变结构的时间序列预测算法及其在电力系统暂态稳定预测中的应用[J];电工技术学报;2002年03期

6 秦斌 ,王欣 ,吴敏;基于RBF神经网络的铁水硅含量预报模型[J];电气传动;2002年03期

7 殷苌茗,陈焕文,谢丽娟;样本有限关联值递归Q学习算法及其收敛性证明[J];计算机研究与发展;2002年09期

8 顾国昌,仲宇,张汝波;一种新的多智能体强化学习算法及其在多机器人协作任务中的应用[J];机器人;2003年04期

9 谢志鹏,蔡灿辉;游戏地图最短路径搜索设计与实现[J];计算机工程与应用;2005年24期

10 朱全民;陈松乔;;五子棋算法的研究与思考[J];计算技术与自动化;2006年02期

中国重要会议论文全文数据库前10条

1 胡光华;;平均准则TD策略迭代算法[A];中国运筹学会第六届学术交流会论文集（上卷）[C];2000年

2 胡光华;殷英;李世云;;即时差分策略迭代算法[A];中国运筹学会第七届学术交流会论文集（下卷）[C];2004年

3 王直杰;方建安;邵世煌;;一种增强式学习算法及其在控制中的应用[A];1996中国控制与决策学术年会论文集[C];1996年

4 王洪岩;朱峰;张雪峰;李玉倩;安爽;徐心和;;一种基于粗神经网络的中国象棋机器博弈评估实现[A];2007中国控制与决策学术年会论文集[C];2007年

5 徐心和;石鸿雁;;一个空战实例中的混合对策问题[A];2007中国控制与决策学术年会论文集[C];2007年

6 朱峰;张雪峰;徐心和;;关于机器博弈中的逐步展开型对策的一点讨论[A];2007中国控制与决策学术年会论文集[C];2007年

7 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年

8 徐义春;韩芳;;结合TD(0)的马尔可夫链扰动分析求解算法[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年

9 任燚;陈宗海;;一种强化学习算法应用于多移动机器人的觅食实例研究[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年

10 徐心和;王浩;孔凡禹;;事件对策理论及在棋类游戏中的应用[A];2007年中国智能自动化会议论文集[C];2007年

中国博士学位论文全文数据库前10条

1 张涛;非线性系统控制策略的研究[D];浙江大学;2001年

2 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年

3 佘震宇;复杂经济系统演化建模研究[D];天津大学;2003年

4 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年

5 赵黎明;灾害管理系统研究[D];天津大学;2003年

6 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年

7 张双民;群体Agent合作求解方法的研究[D];清华大学;2004年

8 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年

9 王醒策;基于强化学习和群集智能方法的多机器人协作协调研究[D];哈尔滨工程大学;2005年

10 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年

中国硕士学位论文全文数据库前10条

1 王醒策;基于强化学习的多机器人编队方法研究[D];哈尔滨工程大学;2002年

2 张必勇;强化学习在用户学习中的应用研究[D];太原理工大学;2003年

3 赵秀粉;蓝牙技术及多代理技术在车间控制系统中的应用研究[D];重庆大学;2003年

4 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年

5 邹丹;自主式水下机器人运动规划技术[D];哈尔滨工程大学;2003年

6 莫建文;机器自学习博弈策略研究与实现[D];广西师范大学;2002年

7 罗宁泉;增强学习在共面双机空战格斗中的应用[D];沈阳工业大学;2003年

8 滕轶栋;移动通信系统信道分配算法研究[D];浙江工业大学;2004年

9 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年

10 孙光余;强化学习及其在空中拦截中的应用[D];沈阳工业大学;2004年

【二级参考文献】

中国期刊全文数据库前10条

1 王骄,王涛,罗艳红,徐心和;中国象棋计算机博弈系统评估函数的自适应遗传算法实现[J];东北大学学报(自然科学版);2005年10期

2 严小卫,莫建文;智能五子棋的设计与实现[J];广西师范大学学报(自然科学版);1999年04期

3 廖家平,舒军,王粟;基于 PDC-PROLOG 自学习机器博弈[J];湖北工学院学报;1997年04期

4 陈焕文,谢丽娟,谢建平;一类值函数激励学习的遗忘算法[J];计算机研究与发展;2001年04期

5 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期

6 陆鑫,高阳,李宁,陈世福;基于神经网络的强化学习算法研究[J];计算机研究与发展;2002年08期

7 殷苌茗,陈焕文,谢丽娟;样本有限关联值递归Q学习算法及其收敛性证明[J];计算机研究与发展;2002年09期

8 张伟,王一川,石纯一;Agent组织规则的再励学习[J];计算机研究与发展;2003年03期

9 谢克明,郭红波,谢刚,续欣莹;人工免疫算法及其应用[J];计算机工程与应用;2005年20期

10 莫建文,林士敏,张顺岚;基于TD强化学习智能博弈程序的设计与实现[J];计算机应用;2004年S1期

中国硕士学位论文全文数据库前2条

1 王骐;博弈树搜索算法的研究及改进[D];浙江大学;2006年

2 张赜;计算机中国象棋博弈中的二次估值方法及其优化的研究[D];东北大学;2006年

中国知网广告投放

中国象棋计算机博弈中搜索算法的研究与改进

《中国学术期刊（光盘版）》电子杂志社有限公司
同方知网数字出版技术股份有限公司
地址：北京清华大学 84-48信箱大众知识服务
京ICP证040441号
互联网出版许可证新出网证（京）字008号
出版物经营许可证新出发京批字第直0595号

订购热线：400-819-9993 010-62982499
服务热线：010-62985026 010-62791813
在线咨询：
传真：010-62780361
京公网安备11010802020475号

本文关键词：机器自学习博弈策略研究与实现，由笔耕文化传播整理发布。

，

本文编号：154479

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/rengongzhinen/154479.html

上一篇：五子棋可行性研究报告
下一篇：基于CA模型的城市用地扩张模拟研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|