当前位置:主页 > 科技论文 > 自动化论文 >

强化学习及其在电脑围棋中的应用

发布时间:2017-10-19 03:21

  本文关键词:强化学习及其在电脑围棋中的应用


  更多相关文章: 强化学习 函数近似 核方法 神经网络 加性模型 深度强化学习


【摘要】:强化学习是一类特殊的机器学习,通过与所在环境的自主交互来学习决策策略,使得策略收到的长期累积奖赏最大.最近,在围棋和电子游戏等领域,强化学习被成功用于取得人类水平的操作能力,受到了广泛关注.本文将对强化学习进行简要介绍,重点介绍基于函数近似的强化学习方法,以及在围棋等领域中的应用.
【作者单位】: 南京邮电大学计算机学院/软件学院;南京大学计算机软件新技术国家重点实验室;
【关键词】强化学习 函数近似 核方法 神经网络 加性模型 深度强化学习
【基金】:国家自然科学基金(61403208;61375061) 南京邮电大学引进人才科研启动基金(NY214014)资助~~
【分类号】:TP181
【正文快照】: 引用格式陈兴国,俞扬.强化学习及其在电脑围棋中的应用.自动化学报,2016,42(5):685-695Reinforcement Learning and Its Application to the Game of GoCHEN Xing-Guo1,2强化学习(Reinforcement learning,RL)是机器学习的子领域[1].在强化学习中,机器(常被称为智能体/Agent)被

【参考文献】

中国期刊全文数据库 前2条

1 王皓;高阳;陈兴国;;强化学习中的迁移:方法和进展[J];电子学报;2008年S1期

2 高阳,陈世福,陆鑫;强化学习研究综述[J];自动化学报;2004年01期

【共引文献】

中国期刊全文数据库 前10条

1 陈兴国;俞扬;;强化学习及其在电脑围棋中的应用[J];自动化学报;2016年05期

2 高雪莹;唐昊;苗刚中;平兆武;;储能系统能量调度与需求响应联合优化控制[J];系统仿真学报;2016年05期

3 谢岩松;金海东;陈冬火;;基于函数近似的知识迁移[J];软件;2016年02期

4 杨娜;李汉舟;;服务机器人导航技术研究进展[J];机电工程;2015年12期

5 栾咏红;章鹏;;强化学习方法的对比分析[J];计算机时代;2015年12期

6 谷学静;高贝贝;朱朝月;;基于人工情感的Q-学习算法在机器人行为决策中的应用[J];自动化与仪表;2015年07期

7 戈军;周莲英;;基于SARSA(λ)的实时交通信号控制模型[J];计算机工程与应用;2015年24期

8 马磊;张文旭;戴朝华;;多机器人系统强化学习研究综述[J];西南交通大学学报;2014年06期

9 傅启明;刘全;尤树华;黄蔚;章晓芳;;一种新的基于值函数迁移的快速Sarsa算法[J];电子学报;2014年11期

10 崔军晓;朱蒙婷;王海燕;章鹏;王辉;;基于强化学习的值迭代算法[J];电脑知识与技术;2014年31期

【二级参考文献】

中国期刊全文数据库 前3条

1 高阳,陆鑫,李宁,陈世福;一种自适应概率规划规则抽取算法[J];南京大学学报(自然科学版);2003年02期

2 李宁,高阳,陆鑫,陈世福;一种基于强化学习的学习Agent[J];计算机研究与发展;2001年09期

3 高阳,周志华,何佳洲,陈世福;基于Markov对策的多Agent强化学习模型及算法研究[J];计算机研究与发展;2000年03期

【相似文献】

中国期刊全文数据库 前10条

1 李秀英;;网络环境下学生学习的特点[J];教师;2009年04期

2 夏定海,黄智英;教会学习 学会学习 终身学习[J];发明与革新;2000年06期

3 黄启兵;汪芳;;论网络时代学习与创新的统一[J];教学研究;2002年03期

4 陈相安;把档案部门建成学习型组织[J];中国档案;2003年09期

5 顾新,蔡兵,李久平;学习与学习型社会[J];软科学;2004年02期

6 郑军;试论编辑的学习特征[J];中国编辑;2005年06期

7 邱晓荣,孔一童;试论网络环境中的合作学习[J];当代教育论坛;2005年02期

8 冷平,王仁蓉,刁永锋;网络学习的成功要素探析[J];教育信息化;2005年03期

9 张建光;朱秀娥;张笑双;;网络学习社区的特征和构建[J];中国教育技术装备;2006年03期

10 徐晓涌;;创建学习型企业莫入误区[J];中国邮政;2006年02期

中国重要会议论文全文数据库 前10条

1 韩文;;让合作学习在逆境中重生[A];中华教育理论与实践科研论文成果选编(第2卷)[C];2010年

2 吕启春;;浅谈小学数学中的小组合作学习[A];2014年1月现代教育教学探索学术交流会论文集[C];2014年

3 杜俊娟;;用学习动机培养策略课题的学习对体育教师进行研究性学习培养的实验研究[A];第七届全国体育科学大会论文摘要汇编(一)[C];2004年

4 瞿春波;;浅议合作学习之误区[A];校园文学编辑部写作教学年会论文集[C];2007年

5 时龙;;把握分析学情是改进教学和促进学习的基础[A];2012·学术前沿论丛——科学发展:深化改革与改善民生(下)[C];2012年

6 韦彩红;;如何组织学生共享学习成果[A];中华教育理论与实践科研论文成果选编(第2卷)[C];2010年

7 格保耿;;培养学生学习物理的兴趣[A];2014年5月现代教育教学探索学术交流会论文集[C];2014年

8 钮荣荣;;关于小学数学教学中小组合作学习的几点思考[A];2014年6月现代教育教学探索学术交流会论文集[C];2014年

9 陈妙;;让数学课堂效率得到真正的提高——浅谈新课改下学生学习兴趣的培养[A];中华教育理论与实践科研论文成果选编(第3卷)[C];2010年

10 黄春妙;;浅谈语文课堂合作学习的有效把握[A];中华教育理论与实践科研论文成果选编(第3卷)[C];2010年

中国重要报纸全文数据库 前10条

1 农行浙江东阳支行 吴新国 周龙飞;银行如何创建学习型组织[N];上海金融报;2003年

2 西北师范大学 李瑾瑜;校长:如何引领和促进教师学习[N];中国教育报;2008年

3 永寿县店头中学 刘俊锋;大力提倡合作学习 全面促进有效教学[N];咸阳日报;2009年

4 本报评论员;要在真学习上下功夫[N];酒泉日报;2009年

5 本报记者 李天然;学习应该是一种终身行为[N];大连日报;2010年

6 刘继芳;浅议建设学习型党组织中的“学习”内涵[N];伊犁日报(汉);2010年

7 哈尔滨市第五医院 蒙硕;浅谈医院创建学习型党组织[N];黑龙江日报;2010年

8 翟爱霞;浅谈如何深入推进学习型党组织建设[N];太行日报;2011年

9 李振 上海交通大学国际与公共事务学院;制度变迁中的制度学习[N];中国社会科学报;2012年

10 重庆市教育评估院院长、中国高等教育学会学习科学研究分会常务副会长 龚春燕;实施新学习,建设学习型社会[N];中国教育报;2013年

中国博士学位论文全文数据库 前10条

1 徐峰;基于社会网络的大学生学习网络结构研究[D];江西财经大学;2014年

2 付亦宁;本科生深层学习过程及其教学策略研究[D];苏州大学;2014年

3 张钰e,

本文编号:1058755


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1058755.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0bbfb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com