阿法狗围棋系统的简要分析
发布时间:2017-11-12 09:13
本文关键词:阿法狗围棋系统的简要分析
更多相关文章: 深度学习 深度卷积神经网络 计算机围棋 强化学习 阿法狗
【摘要】:谷歌的围棋系统阿法狗(AlphaGo)在三月的比赛中以4:1的成绩击败了围棋世界冠军李世石,大大超过了许多人对计算机围棋程序何时能赶上人类职业高手的预期(约10~30年).本文在技术层面分析了阿法狗系统的组成部分,并基于它过去的公开对局预测了它可能的弱点.
【作者单位】: 脸书人工智能研究所;
【分类号】:TP18
【正文快照】: 引用格式田渊栋.阿法狗围棋系统的简要分析.自动化学报,2016,42(5):671-675Alpha Go这个系统[1]主要由几个部分组成:1)走棋网络(Policy network),给定当前局面,预测/采样下一步的走棋.2)快速走子(Fast rollout),目标和走棋网络一样,但在适当牺牲走棋质量的条件下,速度要比走棋,
本文编号:1175252
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1175252.html