基于数据库自学习的中国象棋研究
本文关键词:计算机中国象棋博弈中的二次估值方法及其优化的研究,由笔耕文化传播整理发布。
《河北大学》 2009年
基于数据库自学习的中国象棋研究
邢胜
【摘要】:中国象棋的计算机博弈研究起步较晚,但是发展较快。到目前为止出现了许多优秀的中国象棋软件,如许舜钦及其团队的“ELP”、上海计算机博弈研究所黄晨的“象眼”等。但是这些象棋软件大多数是通过优化数据结构和改进搜索策略等方法提高棋力,虽然也具有较高的博弈水平,但是有自学习能力的却很少。 本文通过引入数据库存储计算机判断失误的对手着法和局面值,从而使象棋软件能够转变策略,避免再次的判断失误,实现自学习能力。 象棋博弈树搜索是中国象棋计算机博弈的关键技术之一。但是博弈树的搜索在没有记忆的情况下不能实现学习,而记忆要借助数据库来实现。付强在其论文中应用了数据库记录计算机所走的最好着法和其局面值,并使用加强学习修改局面值以达到学习的目的。 但是在象棋软件输棋的情况下,主要是由于对对手走棋判断失误造成的,所以记录那些与计算机预想不同的对手着法和展开博弈树后的返回值,再从中选择造成输棋结果的关键着法和值。当下次搜索到相同着法时,将数据库中该着法下的值取出,继续搜索使象棋软件实现策略的转变,达到自学习的目的。
【关键词】:
【学位授予单位】:河北大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP18
【目录】:
下载全文 更多同类文献
CAJ全文下载
(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)
CAJViewer阅读器支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库 前7条
1 王骄,王涛,罗艳红,徐心和;中国象棋计算机博弈系统评估函数的自适应遗传算法实现[J];东北大学学报;2005年10期
2 付强;陈焕文;;基于RL算法的自学习博弈程序设计及实现[J];长沙理工大学学报(自然科学版);2007年04期
3 蒋加伏,陈蔼祥,唐贤英;基于知识推理的博弈树搜索算法[J];计算机工程与应用;2004年01期
4 莫建文,林士敏,张顺岚;基于TD强化学习智能博弈程序的设计与实现[J];计算机应用;2004年S1期
5 高阳,陈世福,陆鑫;强化学习研究综述[J];自动化学报;2004年01期
6 付强;陈焕文;;中国象棋人机对弈的自学习方法研究[J];计算机技术与发展;2007年12期
7 徐心和;王骄;;中国象棋计算机博弈关键技术分析[J];小型微型计算机系统;2006年06期
中国重要会议论文全文数据库 前1条
1 王洪岩;朱峰;张雪峰;李玉倩;安爽;徐心和;;一种基于粗神经网络的中国象棋机器博弈评估实现[A];2007中国控制与决策学术年会论文集[C];2007年
中国硕士学位论文全文数据库 前3条
1 付强;基于激励学习的中国象棋研究[D];长沙理工大学;2006年
2 张赜;计算机中国象棋博弈中的二次估值方法及其优化的研究[D];东北大学;2006年
3 王一非;具有自学习功能的计算机象棋博弈系统的研究与实现[D];哈尔滨工程大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期
2 杨博;王向华;邵利平;覃征;于维虎;;基于群集智能的传感器管理方法研究[J];兵工学报;2012年02期
3 任红格;阮晓钢;;基于Boltzamnn机的机器人自主学习算法[J];北京工业大学学报;2012年01期
4 程晓北;顾国昌;;多智能体分层强化学习研究进展[J];边疆经济与文化;2007年05期
5 李小勇;周锋;杨旭东;倪晖;;多Agent系统中信任预测的SRL模型[J];北京邮电大学学报;2010年06期
6 岳金朋;冯速;;中国象棋Alpha-Beta搜索算法的研究与改进[J];北京师范大学学报(自然科学版);2009年02期
7 王晓鹏;王骄;徐心和;郑新颖;;中国象棋与国际象棋比较分析[J];重庆工学院学报(自然科学版);2007年01期
8 陈向勇;李春吉;李宁;;机器博弈中韩国象棋与中国象棋的比较[J];重庆工学院学报(自然科学版);2008年01期
9 张颖;李祖枢;;棋类计算机博弈系统的主要研究方法及在6子棋上的应用[J];重庆工学院学报(自然科学版);2008年09期
10 黄继平;苗华;张栋;;用遗传算法实现六子棋评估函数参数优化[J];重庆工学院学报(自然科学版);2009年11期
中国重要会议论文全文数据库 前10条
1 刘智勇;马凤伟;;城市交通信号的在线强化学习控制[A];第二十六届中国控制会议论文集[C];2007年
2 冯闻捷;彭力;;牛角棋计算机博弈系统的实现[A];第二十七届中国控制会议论文集[C];2008年
3 李鑫;井元伟;;基于强化学习方法的ATM拥塞控制器的设计[A];2007中国控制与决策学术年会论文集[C];2007年
4 王洪岩;朱峰;张雪峰;李玉倩;安爽;徐心和;;一种基于粗神经网络的中国象棋机器博弈评估实现[A];2007中国控制与决策学术年会论文集[C];2007年
5 徐心和;石鸿雁;;一个空战实例中的混合对策问题[A];2007中国控制与决策学术年会论文集[C];2007年
6 朱峰;张雪峰;徐心和;;关于机器博弈中的逐步展开型对策的一点讨论[A];2007中国控制与决策学术年会论文集[C];2007年
7 王骄;董磊;高旭;徐长明;王峰;张春晖;;大师级象棋机器人的研究与开发[A];2009中国控制与决策会议论文集(1)[C];2009年
8 ;Computer Games Are an Efficient Tool for Event Game Theory[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
9 ;A Storage Structure and Capture Judging Algorithm of Realizing the Computer Game Program of Surakarta Chess[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
10 ;Discussion on Chinese Chess Decision-making System with Emotion[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
中国博士学位论文全文数据库 前10条
1 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
2 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
3 覃健诚;网络多层纵深防御体系的关键技术研究[D];北京邮电大学;2011年
4 尚晶;集装箱码头机械配置与调度策略研究[D];武汉理工大学;2011年
5 李红梅;智能优化方法在电力系统调频中的应用研究[D];上海交通大学;2011年
6 董孟高;基于Agent的自适应系统运行机制及其构造技术研究[D];国防科学技术大学;2011年
7 牛建军;无线传感器网络分布式调度方法研究[D];清华大学;2010年
8 王文渊;沿海港口航道通过能力研究[D];大连理工大学;2011年
9 徐长明;基于连珠模式的六子棋机器博弈关键技术研究[D];东北大学;2010年
10 王长缨;多agent协作团队的学习方法研究[D];国防科学技术大学;2004年
中国硕士学位论文全文数据库 前10条
1 沈扬;协商僵局消解优化问题研究[D];郑州大学;2010年
2 张红;配电网静止同步补偿器控制策略的研究与实现[D];长春工业大学;2010年
3 姜勇;五子棋人机对战系统设计[D];电子科技大学;2010年
4 苏保君;在线组合分类器应用于大规模垃圾邮件过滤的研究[D];浙江大学;2010年
5 张恩海;基于多自动机复合多子类机器博弈及其估值方法研究[D];沈阳大学;2011年
6 吴晓庆;基于认知的异构网络选择技术的研究[D];西安电子科技大学;2011年
7 宋宏宇;基于J2ME平台的手机黑白棋的开发[D];吉林大学;2011年
8 柴雪霞;基于强化学习的Web服务组合优化研究[D];合肥工业大学;2011年
9 任玲;无线传感器网络能量高效的传输策略研究[D];合肥工业大学;2011年
10 毛沙;无线传感器网络节能优化策略研究[D];合肥工业大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 王骄,王涛,罗艳红,徐心和;中国象棋计算机博弈系统评估函数的自适应遗传算法实现[J];东北大学学报;2005年10期
2 汪定伟,容启亮,叶伟雄;企业动态结盟中的伙伴挑选模型及其软计算方法[J];中国科学E辑:技术科学;2002年06期
3 高阳,周志华,何佳洲,陈世福;基于Markov对策的多Agent强化学习模型及算法研究[J];计算机研究与发展;2000年03期
4 陈焕文,谢丽娟,谢建平;一类值函数激励学习的遗忘算法[J];计算机研究与发展;2001年04期
5 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期
6 刘新宇,洪炳鎔;基于BDI框架的多Agent动态协作模型与应用研究[J];计算机研究与发展;2002年07期
7 陆鑫,高阳,李宁,陈世福;基于神经网络的强化学习算法研究[J];计算机研究与发展;2002年08期
8 殷苌茗,陈焕文,谢丽娟;样本有限关联值递归Q学习算法及其收敛性证明[J];计算机研究与发展;2002年09期
9 张伟,王一川,石纯一;Agent组织规则的再励学习[J];计算机研究与发展;2003年03期
10 徐昕,贺汉根;神经网络增强学习的梯度算法研究[J];计算机学报;2003年02期
【相似文献】
中国期刊全文数据库 前10条
1 ;楚河汉界 网上争锋[J];每周电脑报;1998年50期
2 杨水元;棋发明趣谈[J];发明与革新;2001年07期
3 王炳晨;;浪潮天梭再掀2006人机大战新高潮[J];微电脑世界;2006年10期
4 ;综合新闻[J];科技浪潮;2006年07期
5 ;象棋博物馆创办纪实追踪 “中国象棋博物馆”花落谁家?——访筹建办秘书长张丁[J];收藏界;2008年01期
6 ;许银川与天梭握手言和[J];中国计算机用户;2006年33期
7 林健;黄鸿;刘进长;;人工智能烽火点燃中国象棋——记“浪潮杯”首届中国象棋计算机博奕锦标赛暨2006中国机器博奕学术研讨会、“浪潮杯”首届中国象棋人机大战[J];机器人技术与应用;2006年05期
8 尹宏伟;;人机大战 天梭计算机系统解密[J];科技浪潮;2006年08期
9 在川;;中国象棋人机大战 人工智能的里程碑[J];通信世界;2006年30期
10 刘雁飞;醉心象棋革新的老人[J];发明与革新;1999年11期
中国重要会议论文全文数据库 前10条
1 孙丽枫;宋智芳;姜茂发;;连铸保护渣数据库查询系统的开发[A];第七届(2009)中国钢铁年会论文集(上)[C];2009年
2 罗斐;毛宇光;;基于领域分类的查询接口模式抽取方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
3 林向阳;;期刊信息资源共享之探讨[A];改革创新·科学发展——第7届全国核心期刊与期刊国际化、网络化研讨会论文集[C];2009年
4 何一明;覃茂运;;论城市规划测绘在数字城市建设中的作用[A];全国测绘科技信息网中南分网第二十四次学术信息交流会论文集[C];2010年
5 黄迎;冯樑;解丽娜;凌敏;陈碧玲;姚建华;;化学信息学在有机环境污染物管理工作中的应用[A];中国化学会第27届学术年会第02分会场摘要集[C];2010年
6 杨明;杨萍;吉根林;;分布式环境下的隐私保持数据库相似性度量[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 赵伟;王美艳;刘闯;;基于古汉语语料数据库词的划分方法研究与探索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
8 石俊峰;冯丹;;Notes邮件短信提醒系统[A];天气、气候与可持续发展——河南省气象学会2010年年会论文集[C];2010年
9 童小燕;;基于服务器上智能化材料数据库的设计(英文)[A];材料科学与工程技术——中国科协第三届青年学术年会论文集[C];1998年
10 高领花;王亚云;;数据库在预报服务评分系统中的应用[A];数据库技术在气象领域的应用学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 利国;[N];今日信息报;2006年
2 钱晞;[N];四川日报;2008年
3 刘乾胜;[N];围棋报;2009年
4 记者 孙永杰;[N];中国电子报;2006年
5 葛会忠;[N];中国体育报;2006年
6 张艳蕊;[N];中国企业报;2005年
7 记者 苏迅;[N];安阳日报;2006年
8 记者 何屹;[N];科技日报;2005年
9 记者 胡国民 通讯员 陈明喜;[N];黄冈日报;2007年
10 本报记者 邓润青;[N];衡阳日报;2007年
中国博士学位论文全文数据库 前10条
1 贾宁凤;基于AnnAGNPS模型的黄土高原小流域土壤侵蚀和养分流失定量评价[D];中国农业大学;2005年
2 杨龙;利用cDNA/EST序列大规模开发内含子多态性标记的研究[D];浙江大学;2008年
3 韩露;中国岩石圈三维结构数据库网络服务功能研究[D];中国地质大学(北京);2006年
4 张文君;滑坡灾害遥感动态特征监测及其预测分析研究[D];西南交通大学;2007年
5 王雅戈;民国农业文献数字化整理及信息组织研究[D];南京农业大学;2007年
6 刘立杰;张仲景方证论治体系研究及其方证数据库[D];北京中医药大学;2009年
7 孟祥福;Web数据库柔性查询关键技术研究[D];东北大学;2010年
8 陈建宪;论中国洪水故事圈[D];华中师范大学;2005年
9 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
10 李昕;电子商务Web数据库不精确查询方法研究[D];辽宁工程技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 邢胜;基于数据库自学习的中国象棋研究[D];河北大学;2009年
2 任建敏;中国象棋软件开局库和着法生成器的研究[D];燕山大学;2012年
3 裴祥豪;基于剪枝策略的中国象棋搜索引擎研究[D];河北大学;2009年
4 郭秀丽;中国象棋计算机博弈中搜索算法的研究与改进[D];河北大学;2010年
5 王友政;基于局势变化的计算机中国象棋研究[D];东北大学;2008年
6 于超;博弈算法在中国象棋上的应用[D];中国海洋大学;2011年
7 郭峰;中国象棋计算机博弈中的判别剪枝搜索研究[D];河北大学;2009年
8 谢国;中国象棋机器博弈数据结构设计与搜索算法研究[D];西安理工大学;2008年
9 方珍;基于Android平台的中国象棋设计与实现[D];电子科技大学;2011年
10 何玉林;瞬时差分方法在中国象棋计算机博弈中的应用[D];河北大学;2009年
本文关键词:计算机中国象棋博弈中的二次估值方法及其优化的研究,由笔耕文化传播整理发布。
,本文编号:152800
本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/152800.html