基于Actor-Critic学习的自适应PID控制策略研究
发布时间:2022-08-23 22:50
PID控制器是现代工业中最常用的控制器,具有结构简单、容易实现、控制效果好和鲁棒性强等特点,能够满足一般的工业控制要求。随着技术的进步,人们对控制精度要求不断提高。电液伺服系统存在非线性、时变性、不确定性和干扰力等因素。实现高精度控制,控制器的参数应该随着系统变化而自动调整到最佳,而常规PID控制器在控制过程中,参数一旦确定,就无法调整。因此,对于精度要求高的系统,常规PID控制器往往难以达到理想的控制效果。由于人工智能技术的迅速发展,研究人员将人工智能算法与PID控制结合起来,能够实现参数自适应的PID控制器成为了研究热点,拥有较高的研究价值和广阔的应用前景。强化学习作为一种机器学习方法,强调在与环境交互学习中获得评价性的回报信号,以极大化未来的回报为学习目标。它不需要教师信号,在求解先验信息较少的复杂优化决策问题中应用广泛。在多种领域中,已显示出其性能优势。因此,本文提出了一种基于强化学习思想中Actor-Critic结构的控制策略,以解决PID参数不能在线调整的问题。该策略不需先验知识,能够对参数进行在线调整,实现系统性能优化。通过MATLAB中的Simulink模块进行仿真分析...
【文章页数】:71 页
【学位级别】:硕士
【图文】:
电液伺服系统组成框图
fi开环系统bode图
强化学习基本框架
【参考文献】:
期刊论文
[1]基于Actor-Critic和神经网络的闭环脑机接口控制器设计[J]. 孙京诰,杨嘉雄,王硕,薛瑞,潘红光. 控制与决策. 2018(11)
[2]增量式双自然策略梯度的行动者评论家算法[J]. 章鹏,刘全,钟珊,翟建伟,钱炜晟. 通信学报. 2017(04)
[3]改进型Smith-专家PID算法在烘缸温度串级系统上的应用[J]. 张爱娟,胡慕伊,黄亚南. 化工自动化及仪表. 2016(02)
[4]大数据环境下的增强学习综述[J]. 仵博,冯延蓬,孟宪军,江建举,何国坤. 深圳职业技术学院学报. 2014(03)
[5]电液伺服系统位置和力模糊切换控制方法[J]. 高炳微,邵俊鹏,韩桂华. 电机与控制学报. 2014(05)
[6]电液伺服技术的发展与展望[J]. 王军政,赵江波,汪首坤. 液压与气动. 2014(05)
[7]增强学习的PID控制参数优化快速整定算法[J]. 刘岩. 计算机测量与控制. 2014(02)
[8]基于核方法的连续动作Actor-Critic学习[J]. 陈兴国,高阳,范顺国,俞亚君. 模式识别与人工智能. 2014(02)
[9]基于虚拟轧制的冷带轧机压下电液伺服系统建模与仿真[J]. 孙孟辉,张伟,王益群. 机床与液压. 2012(09)
[10]具有最优学习率的RBF神经网络及其应用[J]. 卫敏,余乐安. 管理科学学报. 2012(04)
博士论文
[1]连续空间强化学习研究[D]. 张春元.电子科技大学 2016
硕士论文
[1]基于RBF神经网络的PID自校正控制研究及应用[D]. 朱逢锐.安徽理工大学 2017
[2]基于强化学习的移动机器人路径规划研究[D]. 刘仕超.山东科技大学 2017
[3]电液伺服系统液压缸非线性运动特征研究[D]. 武文开.燕山大学 2016
[4]基于增强学习的启发式和元启发式搜索的参数调优策略[D]. 刘赛赛.电子科技大学 2016
[5]基于贝叶斯理论的行动者评论家算法研究[D]. 陈仕超.苏州大学 2015
[6]强化学习中值函数逼近方法的研究[D]. 陈桂兴.苏州大学 2014
[7]基于粒子群算法的液压位置伺服系统的研究[D]. 许来.合肥工业大学 2014
[8]基于增强学习的无人车辆智能决策方法研究[D]. 郑睿.国防科学技术大学 2013
[9]电液伺服系统PID神经网络控制策略研究与应用[D]. 李拓彬.中南大学 2013
[10]基于改进粒子群算法的BP神经网络优化及应用[D]. 王耀东.西安科技大学 2012
本文编号:3678627
【文章页数】:71 页
【学位级别】:硕士
【图文】:
电液伺服系统组成框图
fi开环系统bode图
强化学习基本框架
【参考文献】:
期刊论文
[1]基于Actor-Critic和神经网络的闭环脑机接口控制器设计[J]. 孙京诰,杨嘉雄,王硕,薛瑞,潘红光. 控制与决策. 2018(11)
[2]增量式双自然策略梯度的行动者评论家算法[J]. 章鹏,刘全,钟珊,翟建伟,钱炜晟. 通信学报. 2017(04)
[3]改进型Smith-专家PID算法在烘缸温度串级系统上的应用[J]. 张爱娟,胡慕伊,黄亚南. 化工自动化及仪表. 2016(02)
[4]大数据环境下的增强学习综述[J]. 仵博,冯延蓬,孟宪军,江建举,何国坤. 深圳职业技术学院学报. 2014(03)
[5]电液伺服系统位置和力模糊切换控制方法[J]. 高炳微,邵俊鹏,韩桂华. 电机与控制学报. 2014(05)
[6]电液伺服技术的发展与展望[J]. 王军政,赵江波,汪首坤. 液压与气动. 2014(05)
[7]增强学习的PID控制参数优化快速整定算法[J]. 刘岩. 计算机测量与控制. 2014(02)
[8]基于核方法的连续动作Actor-Critic学习[J]. 陈兴国,高阳,范顺国,俞亚君. 模式识别与人工智能. 2014(02)
[9]基于虚拟轧制的冷带轧机压下电液伺服系统建模与仿真[J]. 孙孟辉,张伟,王益群. 机床与液压. 2012(09)
[10]具有最优学习率的RBF神经网络及其应用[J]. 卫敏,余乐安. 管理科学学报. 2012(04)
博士论文
[1]连续空间强化学习研究[D]. 张春元.电子科技大学 2016
硕士论文
[1]基于RBF神经网络的PID自校正控制研究及应用[D]. 朱逢锐.安徽理工大学 2017
[2]基于强化学习的移动机器人路径规划研究[D]. 刘仕超.山东科技大学 2017
[3]电液伺服系统液压缸非线性运动特征研究[D]. 武文开.燕山大学 2016
[4]基于增强学习的启发式和元启发式搜索的参数调优策略[D]. 刘赛赛.电子科技大学 2016
[5]基于贝叶斯理论的行动者评论家算法研究[D]. 陈仕超.苏州大学 2015
[6]强化学习中值函数逼近方法的研究[D]. 陈桂兴.苏州大学 2014
[7]基于粒子群算法的液压位置伺服系统的研究[D]. 许来.合肥工业大学 2014
[8]基于增强学习的无人车辆智能决策方法研究[D]. 郑睿.国防科学技术大学 2013
[9]电液伺服系统PID神经网络控制策略研究与应用[D]. 李拓彬.中南大学 2013
[10]基于改进粒子群算法的BP神经网络优化及应用[D]. 王耀东.西安科技大学 2012
本文编号:3678627
本文链接:https://www.wllwen.com/jixiegongchenglunwen/3678627.html