当前位置:主页 > 科技论文 > 自动化论文 >

阿法狗围棋系统的简要分析

发布时间:2017-11-12 09:13

  本文关键词:阿法狗围棋系统的简要分析


  更多相关文章: 深度学习 深度卷积神经网络 计算机围棋 强化学习 阿法狗


【摘要】:谷歌的围棋系统阿法狗(AlphaGo)在三月的比赛中以4:1的成绩击败了围棋世界冠军李世石,大大超过了许多人对计算机围棋程序何时能赶上人类职业高手的预期(约10~30年).本文在技术层面分析了阿法狗系统的组成部分,并基于它过去的公开对局预测了它可能的弱点.
【作者单位】: 脸书人工智能研究所;
【分类号】:TP18
【正文快照】: 引用格式田渊栋.阿法狗围棋系统的简要分析.自动化学报,2016,42(5):671-675Alpha Go这个系统[1]主要由几个部分组成:1)走棋网络(Policy network),给定当前局面,预测/采样下一步的走棋.2)快速走子(Fast rollout),目标和走棋网络一样,但在适当牺牲走棋质量的条件下,速度要比走棋

本文编号:1175252

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1175252.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户84d79***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com