久棋强化学习博弈研究及多媒体课件开发
【学位单位】:中央民族大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:G434;G891.9
【部分图文】:
久棋棋盘有纵横各十四条等距离,纵横交叉的平行线,形成196个落子点。类似于逡逑围棋棋盘,但又有区别,久棋棋盘的中心有一条连接两个落子点的斜线,也是久棋对弈逡逑布局和对战阶段的开端。久棋棋盘如图1-1所示。逡逑“久”在藏语中的意义是“方”,在对弈过程中形成方形是致胜的关键,以基本四子逡逑形成方形为基础久棋衍生出“褡裢”、“拉萨”阵等多种阵型,布局阶段以形成这些阵型逡逑为思考,对阵阶段则在攻守过程中形成这些阵型、阻止对方形成这些阵型形成优势取得逡逑胜利。久棋还有“宁久”,“固久”和“久钦”等许多不同的“方”形,基础方形如图1-2逡逑所示。逡逑0邋J邋I邋3逦-4逦5邋S逦H邋n邋S3逡逑:辨=====j::逡逑13邋’一一"…逦 一一’;逡逑5!广?十-…一.I逡逑图1_1久棋棋盘逡逑\逡逑1逡逑
久棋棋盘有纵横各十四条等距离,纵横交叉的平行线,形成196个落子点。类似于逡逑围棋棋盘,但又有区别,久棋棋盘的中心有一条连接两个落子点的斜线,也是久棋对弈逡逑布局和对战阶段的开端。久棋棋盘如图1-1所示。逡逑“久”在藏语中的意义是“方”,在对弈过程中形成方形是致胜的关键,以基本四子逡逑形成方形为基础久棋衍生出“褡裢”、“拉萨”阵等多种阵型,布局阶段以形成这些阵型逡逑为思考,对阵阶段则在攻守过程中形成这些阵型、阻止对方形成这些阵型形成优势取得逡逑胜利。久棋还有“宁久”,“固久”和“久钦”等许多不同的“方”形,基础方形如图1-2逡逑所示。逡逑0邋J邋I邋3逦-4逦5邋S逦H邋n邋S3逡逑:辨=====j::逡逑13邋’一一"…逦 一一’;逡逑5!广?十-…一.I逡逑图1_1久棋棋盘逡逑\逡逑1逡逑
CTS算法在模拟过程中是采用随机落子的方式进行模拟,模拟到样的方法在没有先验知识的情况下搜索层级较少,搜索效率不高。和MCTS是一样的,但在搜索过程中加入了邋UCB公式,通过UCB公值,进行比较并选择。逡逑选择节点:在博弈树内选择节点,通常为没有探索过的节点,如,则通过UCB公式结合选择策略进行选择。逡逑扩展节点:当选择好需要进行扩展的节点,对其进行扩展即棋局模拟:根据扩展的子节点为根节点,随机模拟下一步的动作进入直到博弈结束判定胜负,得到最终得分。逡逑回溯更新:将最终的得分沿着模拟路线向上传递,不断地从子节法的搜索流程如图2-1所示:逡逑广—?邋Selection邋逦?邋Expansion邋邋?邋Simulation邋一 ̄?邋Backpropagation逡逑
【相似文献】
相关期刊论文 前10条
1 何秋钊;汪家保;刘慕磊;;基于票价对比分析高铁与民航的博弈研究[J];全国流通经济;2017年15期
2 韩晓妮;;基于用户满意度的12306网站博弈研究[J];智库时代;2017年08期
3 韩茜;蔡红玲;;禽流感影响下的蛋鸡行业订单履约问题博弈研究[J];现代经济信息;2017年18期
4 程海明;;我国非存放组织洗钱行为的博弈研究[J];金融经济;2017年10期
5 黄金玲;;快递企业运营模式的博弈研究[J];物流科技;2017年10期
6 王泽龙;袁琳;;诗人“余秀华媒介景观”与话语博弈研究[J];华中学术;2018年02期
7 王刚;马辉;;群体事件中利益集团的博弈研究[J];湖北函授大学学报;2009年03期
8 唐文敏;;流动商贩与城管之间的博弈研究[J];改革与开放;2014年21期
9 黄媛媛;;统一视角下供应链应收账款相关方博弈研究[J];现代商贸工业;2017年33期
10 黄腾飞,熊季霞;中国期货市场初级阶段的博弈研究[J];济南金融;2004年08期
相关会议论文 前10条
1 杜爱霞;;论防范舞弊的二元治理机制——内部控制、舞弊、内部审计的三方博弈研究[A];中国内部审计协会2005年度全国“舞弊的防范与检查”理论研讨暨经验交流会一二等奖论文汇编[C];2005年
2 陈思静;;“自己人”与“外人”:社会两难框架下信任与不确定性的关系[A];第十一届全国心理学学术会议论文摘要集[C];2007年
3 高红贵;;中国绿色经济发展中的诸方博弈研究[A];2011中国可持续发展论坛2011年专刊(一)[C];2011年
4 林珊君;;企业竞争博弈研究[A];中国企业运筹学[2012(1)][C];2012年
5 卓成霞;;金融危机下保就业与保经济增长的博弈研究[A];建设经济文化强省:挑战·机遇·对策——山东省社会科学界2009年学术年会文集(2)[C];2009年
6 申璞琛;高金伍;;基于可信性理论的模糊联盟博弈研究[A];第三届中国智能计算大会论文集[C];2009年
7 顾新;李久平;;知识链成员之间利益分配的n人合作博弈研究[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
8 尹晨;;中央政府与地方政府经济调控政策博弈研究——以房地产市场调控为例[A];用科学发展观统领中国经济发展——全国高校社会主义经济理论与实践研讨会第十九次大会论文集[C];2005年
9 王香玲;;通过鼓励代替惩罚提高社会规范的遵从[A];中国心理学会发展心理专业委员会第十三届学术年会摘要集[C];2015年
10 杜爱霞;;论防范舞弊的二元治理机制——内部控制、舞弊、内部审计的三方博弈研究[A];舞弊的防范与检查论文汇编[C];2005年
相关重要报纸文章 前3条
1 本报评论员 高初建;多一点博弈研究[N];中华工商时报;2012年
2 贾薇邋李洋;公共文化服务必须做到有效供给[N];北京日报;2007年
3 任建军;导弹攻防 对弈有方[N];解放军报;2012年
相关博士学位论文 前8条
1 边文霞;保险欺诈问题博弈研究[D];首都经济贸易大学;2005年
2 钟春洋;经济增长方式转变的利益博弈研究[D];厦门大学;2008年
3 李胜;跨行政区流域水污染府际博弈研究[D];湖南大学;2011年
4 范合君;中国垄断产业放松规制与机制设计博弈研究[D];首都经济贸易大学;2008年
5 徐朝锋;国际技术标准竞争中的国家利益与有筹码的博弈研究[D];北京邮电大学;2014年
6 王崇鲁;基于双边市场理论下的新兴视频产业收益分配及竞合博弈研究[D];北京邮电大学;2011年
7 邓韬;地方权益集团及其相关主体的博弈研究[D];东北财经大学;2014年
8 王斌;环境污染治理与规制博弈研究[D];首都经济贸易大学;2013年
相关硕士学位论文 前10条
1 王松;久棋强化学习博弈研究及多媒体课件开发[D];中央民族大学;2019年
2 王舒婷;人民币中亚区域化的利益博弈研究[D];兰州财经大学;2019年
3 王黛芳;民国时期上海新闻界与政府间的博弈研究(1912-1937)[D];浙江工商大学;2018年
4 沈蓓蓓;邻避事件中的决策博弈研究[D];苏州大学;2017年
5 董英兰;房地产市场博弈研究[D];首都经济贸易大学;2006年
6 蒋宗峰;民营企业社会责任履行与政府监管的博弈研究[D];中国海洋大学;2006年
7 施倩;国际货运代理竞合博弈研究分析[D];大连海事大学;2008年
8 蔡灿泉;农村计划生育政策执行中的利益博弈研究[D];汕头大学;2008年
9 张晓亮;排污权交易中的中央政府与地方政府博弈研究[D];中南大学;2009年
10 朱文丽;航空公司多航节舱位控制博弈研究[D];南京航空航天大学;2016年
本文编号:2825478
本文链接:https://www.wllwen.com/jiaoyulunwen/jgkg/2825478.html