当前位置:主页 > 科技论文 > 自动化论文 >

突破通过机器进行学习的极限

发布时间:2018-04-06 03:15

  本文选题:强化学习 切入点:深度学习 出处:《科学通报》2016年33期


【摘要】:学习能力是人类智能的根本特征.2016年3月,Google公司的Alpha Go把深度神经网络与蒙特卡罗树形搜索结合起来,以4胜1负的成绩战胜了围棋世界冠军韩国的李世石.这一结果标志人工智能取得了重大进展.本文重点介绍Alpha Go采用的机器学习方法,包括强化学习、深度学习、深度强化学习,分析存在的问题和最新的研究进展.为了突破通过计算机进行学习的极限,提出认知机器学习,列举可能的研究方向开展研究,使机器智能不断进化,逐步达到人类水平.
[Abstract]:Learning ability is a fundamental feature of human intelligence. In March 2016, Alpha go combined depth neural networks with Monte Carlo tree search to win 4-1 against go world champion Lee Shih-shih of South Korea.This result marks a significant advance in artificial intelligence.This paper focuses on the machine learning methods used by Alpha go, including reinforcement learning, deep learning, deep reinforcement learning, analysis of existing problems and recent research progress.In order to break through the limit of learning by computer, this paper puts forward cognitive machine learning, enumerates the possible research directions and makes machine intelligence evolve continuously and gradually reach the human level.
【作者单位】: 中国科学院计算技术研究所;
【基金】:国家重点基础研究发展计划(2013CB329502)资助
【分类号】:TP181

【相似文献】

相关期刊论文 前10条

1 汪云九,姚国正;神经系统中学习和记忆的数学模型[J];自然杂志;1987年11期

2 冯英伟;韩瑛;;基于Agent技术的网络教育学习者分析[J];教育信息化;2006年20期

3 吴元斌;;单agent强化学习与多agent强化学习比较研究[J];电脑与信息技术;2009年01期

4 汪国华;;CBR模式下个体进行高效率学习的思考[J];数学通讯;2009年06期

5 王星;方滨兴;张宏莉;何慧;赵蕾;;关系分类的学习界限研究[J];软件学报;2013年11期

6 张景祥;王士同;邓赵红;李奕;蒋亦樟;;具有协同约束的共生迁移学习算法研究[J];电子学报;2014年03期

7 孙方平;符秀辉;;复杂环境下机器人的行为学习研究[J];仪器仪表学报;2006年S3期

8 赵凤飞;覃征;;一种多动机强化学习框架[J];计算机研究与发展;2013年02期

9 余志刚,徐华中;变学习因子神经网络自适应控制研究[J];武汉汽车工业大学学报;1997年02期

10 周浦城;洪炳昒;韩学东;郭耸;;基于多Agent的并行Q-学习算法[J];小型微型计算机系统;2006年09期

相关博士学位论文 前1条

1 龙明盛;迁移学习问题与方法研究[D];清华大学;2014年

相关硕士学位论文 前7条

1 李杰龙;基于主动学习的多示例多标签学习算法研究[D];广东工业大学;2016年

2 谢江龙;面向张量数据的迁移学习研究与应用[D];广东工业大学;2016年

3 焦夏;基于多Agent的移动学习模型研究[D];宁波大学;2013年

4 马海鹏;泛在学习环境下一种学习控制模型的研究[D];陕西师范大学;2014年

5 宋碧慧;基于多Agent协作强化学习的研究[D];湖南大学;2013年

6 郭世硕;多源迁移学习的研究[D];西安电子科技大学;2014年

7 陈春磊;学习设计中学习目标的研究与应用[D];湖南大学;2007年



本文编号:1717716

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1717716.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8d021***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com