社科论文管理论文经济论文科技论文教育论文文艺论文医学论文外语论文硕博论文法律论文理工论文农业论文

当前位置：主页 > 科技论文 > 自动化论文 >

分层强化学习综述

发布时间：2018-04-01 17:39

本文选题：人工智能　切入点：机器学习　出处：《智能系统学报》2017年05期

【摘要】：强化学习(reinforcement learning)是机器学习和人工智能领域的重要分支,近年来受到社会各界和企业的广泛关注。强化学习算法要解决的主要问题是,智能体如何直接与环境进行交互来学习策略。但是当状态空间维度增加时,传统的强化学习方法往往面临着维度灾难,难以取得好的学习效果。分层强化学习(hierarchical reinforcement learning)致力于将一个复杂的强化学习问题分解成几个子问题并分别解决,可以取得比直接解决整个问题更好的效果。分层强化学习是解决大规模强化学习问题的潜在途径,然而其受到的关注不高。本文将介绍和回顾分层强化学习的几大类方法。
[Abstract]:Reinforcement learning is an important branch of machine learning and artificial intelligence, which has attracted wide attention from all walks of life and enterprises in recent years. The main problems to be solved by reinforcement learning algorithms are, However, when the dimension of state space increases, the traditional reinforcement learning methods often face the disaster of dimension. Hierarchical reinforcement learning aims to decompose a complex reinforcement learning problem into several sub-problems and solve them separately. Hierarchical reinforcement learning is a potential way to solve large-scale reinforcement learning problems, but its attention is not high. This paper will introduce and review several kinds of hierarchical reinforcement learning methods.
【作者单位】：南京大学软件新技术国家重点实验室;
【基金】：国家自然科学基金项目(61375061) 江苏省自然科学基金项目(BK20160066)
【分类号】：TP18

【相似文献】

相关期刊论文前10条

1 夏润海,王开颜;机器学习与智能决策支持系统[J];潍坊学院学报;2003年02期

2 张明玉,倪志伟;基于机器学习的智能决策支持系统[J];淮南师范学院学报;2005年03期

3 杨凌霄;武建平;;机器学习方法在人脸检测中的应用[J];计算机与数字工程;2008年03期

4 ;第十一届中国机器学习会议[J];智能系统学报;2008年02期

5 ;第14届中国机器学习会议[J];智能系统学报;2012年06期

6 费宗铭;吕建;王志坚;陈道蓄;徐家福;;机器学习[J];计算机科学;1991年01期

7 赵沁平;魏华;王军玲;;机器学习技术与机器学习系统[J];计算机科学;1993年05期

8 姚敏;机器学习及其发展方向[J];计算机时代;1994年04期

9 ;第31届机器学习国际会议(英文)[J];智能系统学报;2014年01期

10 黄海滨;机器学习及其主要策略[J];河池师范高等专科学校学报(自然科学版);2000年04期

相关会议论文前10条

1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集（上册）[C];2001年

2 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

3 周晴杰;徐立鸿;吴启迪;;机器学习串级结构的初步探讨[A];1998年中国控制会议论文集[C];1998年

4 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集（第2卷）[C];2005年

5 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

6 黄金铁;李景银;周建常;;对高炉炉况评价模型参数的机器学习——一个三类线性模式分类器的实现[A];1995中国控制与决策学术年会论文集[C];1995年

7 程国建;蔡磊;潘华贤;;核向量机在大规模机器学习中的应用[A];第十一届中国青年信息与管理学者大会论文集[C];2009年

8 张钹;张铃;;统计学习理论及其应用[A];2001年中国智能自动化会议论文集（上册）[C];2001年

9 周川;林学，

本文编号：1696628

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1696628.html

上一篇：基于Kleinman迭代算法的非线性系统自适应控制器设计
下一篇：基于吉林一号遥感图像的星载目标快速识别系统

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

最近更新

教材专著

·主编|副主编|备案副主编|编委|参编

热点文章

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明：资料由用户2c7fd***提供，本站仅收录摘要或目录，作者需要删除请E-mail邮箱bigeng88@qq.com