当前位置:主页 > 科技论文 > 自动化论文 >

基于强化学习的倒立摆控制算法研究

发布时间:2022-01-09 10:48
  科技时代,人工智能充斥在我们生活的各个领域,从AIphaGo到AlphaZero都在渔释着它的强大。机器学习作为人工智能的核心,是使计算机具有智能的根本途径。强化学习作为机器学习研究领域的一个热门方向,其通过智能体与环境的交互作用,从中汲取经验,以自学习的方式不断更新改进控制策略,逐步达到最优或近优控制效果。由于强化学习是一种无模型无监督的机器学习方法,因此具有通用性强,适用范围广泛,参数自整定等优点,能够极大降低控制系统的设计难度和人力投入,具有广阔的应用前景。因此,研究强化学习具有重要的理论价值和实际工程应用价值。倒立摆系统是一个多变量、非线性、高阶次、强耦合的自不稳定系统,能够模拟反映多数常见的控制对象,其控制算法具有多输入单输出的特点,因而是一种典型的自动控制理论研究装置。以该问题作为研究对象,能够有效反映出控制算法在实际应用系统中的随动性、鲁棒性、跟踪及镇定性等问题。因此,本文以一级直线倒立摆系统为对象,进行深度强化学习算法的研究。主要研究内容以及成果如下:(1)对强化学习的基础概念进行介绍并分析。通过对常用强化学习算法的理论推导和马尔科夫决策过程各参数分析,为强化学习以及深... 

【文章来源】:西安理工大学陕西省

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

基于强化学习的倒立摆控制算法研究


强化学习示意图

示意图,倒立摆系统,物理,一级


图 2-5 一级直线倒立摆系统物理示意图al schematic diagram of a linear inverted p的复杂系统,倒立摆系统模型的建

画面,行为空间,倒立摆,状态变量


图 3-1 Cartpole 仿真画面Fig.3-1 Cartpole simulation screen态变量、行为空间、倒立摆小车的运动空间、倒了定义。其中状态变量(state)为 4 维,分别为

【参考文献】:
期刊论文
[1]深度强化学习研究综述[J]. 赵星宇,丁世飞.  计算机科学. 2018(07)
[2]基于加权密集连接卷积网络的深度强化学习方法[J]. 夏旻,宋稳柱,施必成,刘佳.  计算机应用. 2018(08)
[3]深度强化学习进展:从AlphaGo到AlphaGo Zero[J]. 唐振韬,邵坤,赵冬斌,朱圆恒.  控制理论与应用. 2017(12)
[4]深度强化学习综述[J]. 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.  计算机学报. 2018(01)
[5]深度强化学习综述:兼论计算机围棋的发展[J]. 赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红.  控制理论与应用. 2016(06)
[6]强化学习模型及其在避障中的应用[J]. 孙魁,吴成东.  山东工业技术. 2016(01)
[7]倒立摆系统的发展研究以及意义[J]. 韩复健.  山东工业技术. 2014(17)
[8]倒立摆系统数学建模与PID控制器实现[J]. 杜岗,徐静.  连云港职业技术学院学报. 2013(02)
[9]基于神经网络的强化学习研究概述[J]. 尤树华,周谊成,王辉.  电脑知识与技术. 2012(28)
[10]强化学习研究综述[J]. 陈学松,杨宜民.  计算机应用研究. 2010(08)

博士论文
[1]非参数化值函数逼近强化学习研究[D]. 季挺.南昌大学 2018

硕士论文
[1]强化学习在倒立摆起摆及平衡控制中的应用研究[D]. 毛文杰.西安理工大学 2018
[2]基于深度神经网络的特征提取算法及其应用研究[D]. 李蓓蓓.江南大学 2018
[3]基于深度强化学习的视频游戏决策模型研究与应用[D]. 郭勤.江西理工大学 2018
[4]基于深度强化学习的游戏博弈策略的研究与实现[D]. 吴睿.吉林大学 2018
[5]基于深度强化学习的游戏控制算法研究与实现[D]. 颜志鹏.电子科技大学 2018
[6]基于DQN的机械臂控制策略的研究[D]. 郭宪.北京交通大学 2018
[7]基于深度强化学习在游戏上的应用[D]. 王康.沈阳理工大学 2018
[8]基于深度卷积神经网络的人脸表情识别方法[D]. 陈科雯.西安电子科技大学 2017
[9]贝叶斯强化学习中策略迭代算法研究[D]. 尤树华.苏州大学 2016
[10]直线倒立摆控制策略的对比研究[D]. 丁丽.齐鲁工业大学 2015



本文编号:3578569

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3578569.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c7632***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com