基于策略迭代的线性奇异摄动系统自学习最优控制
发布时间:2021-05-14 14:31
奇异摄动系统是一类快、慢动态耦合的双时间尺度系统,广泛存在于电力系统、化工过程、机器人等领域。现有奇异摄动系统最优控制方法主要局限于模型参数已知的情况。自适应动态规划是一种可以在模型完全未知下设计最优控制器的自学习技术,已经广泛用于解决弱耦合、双线性、交联等复杂系统相关最优控制问题。由于共存的快、慢现象,现有自学习最优控制方法直接应用到模型未知的奇异摄动系统上会导致“病态数值问题”。因此,本论文面向模型未知的线性奇异摄动系统,把自适应动态规划方法和系统的双时间尺度结构特点相结合,研究基于策略迭代的自学习最优控制方法,目标是克服常规自学习控制方法的“病态数值问题”,提出良性的在线学习算法。主要工作概括如下:1.针对模型未知的线性奇异摄动系统最优状态调节控制问题,设计一种基于策略迭代的在线学习算法。首先,基于代价函数参数矩阵解的结构特点,重构传统Kleinman算法涉及的Lyapunov方程,提出一种改进的Kleinman算法;其次,根据积分贝尔曼方程和系统双时间尺度特性,设计一种基于数据的良性在线策略迭代算法;然后,在分析两种算法等价性的基础上证明所提在线算法的收敛性与闭环系统的稳定性;...
【文章来源】:中国矿业大学江苏省 211工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
符号注释表
1 绪论
1.1 研究背景与意义
1.2 自适应动态规划概述
1.3 奇异摄动系统概述
1.4 研究内容与创新点
2 基于策略迭代的线性奇异摄动系统最优状态调节控制
2.1 问题描述和预备知识
2.2 最优状态调节控制器设计
2.3 性能分析
2.4 仿真结果
2.5 本章小结
3 基于策略迭代的线性奇异摄动系统混合H2/H∞控制
3.1 问题描述和预备知识
3.2 混合H_2/H_∞控制器设计
3.3 性能分析
3.4 仿真结果
3.5 本章小结
4 基于策略迭代的线性奇异摄动系统最优输出跟踪控制
4.1 问题描述和预备知识
4.2 最优输出跟踪控制器设计
4.3 性能分析
4.4 仿真结果
4.5 本章小结
5 结论与展望
5.1 总结
5.2 展望
参考文献
作者简历
学位论文数据集
【参考文献】:
期刊论文
[1]一种基于强化学习的自主导航控制算法研究[J]. 王涛,王立强,李宇飞. 计算机仿真. 2018(11)
[2]自动化科学与技术发展方向[J]. 柴天佑. 自动化学报. 2018(11)
[3]Buck型变换器输出跟踪的自适应动态规划算法[J]. 李健,沈艳军,刘允刚. 控制理论与应用. 2017(03)
[4]基于自适应动态规划的导弹制导律研究综述[J]. 孙景亮,刘春生. 自动化学报. 2017(07)
[5]工业过程控制系统研究现状与发展方向[J]. 柴天佑. 中国科学:信息科学. 2016(08)
[6]基于自适应动态规划的储能系统优化控制方法[J]. 李相俊,张晶琼,何宇婷,惠东. 电网技术. 2016(05)
[7]具有未知动态的线性系统二人零和博弈问题在线学习方案[J]. 富月,柴天佑. 控制理论与应用. 2015(02)
[8]基于数据的自学习优化控制:研究进展与展望[J]. 刘德荣,李宏亮,王鼎. 自动化学报. 2013(11)
[9]线性Markov切换系统的随机Nash微分博弈及混合H2/H∞控制[J]. 朱怀念,张成科,王明亮. 控制与决策. 2013(08)
[10]自适应动态规划综述[J]. 张化光,张欣,罗艳红,杨珺. 自动化学报. 2013(04)
博士论文
[1]几类非线性奇异摄动系统的稳定性分析与控制[D]. 张艳.南京理工大学 2015
[2]基于近似动态规划的优化控制研究及在电力系统中的应用[D]. 秦春斌.东北大学 2014
硕士论文
[1]数据与模型混合驱动的双时间尺度系统次优控制[D]. 钟珊珊.中国矿业大学 2019
[2]工业过程多速率分层运行优化控制[D]. 陆文捷.中国矿业大学 2019
[3]自适应最优跟踪控制及在SCARA机器人系统应用[D]. 侯大为.昆明理工大学 2018
[4]自适应动态规划在电力系统中的应用研究[D]. 程亮.华中科技大学 2014
本文编号:3185810
【文章来源】:中国矿业大学江苏省 211工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
符号注释表
1 绪论
1.1 研究背景与意义
1.2 自适应动态规划概述
1.3 奇异摄动系统概述
1.4 研究内容与创新点
2 基于策略迭代的线性奇异摄动系统最优状态调节控制
2.1 问题描述和预备知识
2.2 最优状态调节控制器设计
2.3 性能分析
2.4 仿真结果
2.5 本章小结
3 基于策略迭代的线性奇异摄动系统混合H2/H∞控制
3.1 问题描述和预备知识
3.2 混合H_2/H_∞控制器设计
3.3 性能分析
3.4 仿真结果
3.5 本章小结
4 基于策略迭代的线性奇异摄动系统最优输出跟踪控制
4.1 问题描述和预备知识
4.2 最优输出跟踪控制器设计
4.3 性能分析
4.4 仿真结果
4.5 本章小结
5 结论与展望
5.1 总结
5.2 展望
参考文献
作者简历
学位论文数据集
【参考文献】:
期刊论文
[1]一种基于强化学习的自主导航控制算法研究[J]. 王涛,王立强,李宇飞. 计算机仿真. 2018(11)
[2]自动化科学与技术发展方向[J]. 柴天佑. 自动化学报. 2018(11)
[3]Buck型变换器输出跟踪的自适应动态规划算法[J]. 李健,沈艳军,刘允刚. 控制理论与应用. 2017(03)
[4]基于自适应动态规划的导弹制导律研究综述[J]. 孙景亮,刘春生. 自动化学报. 2017(07)
[5]工业过程控制系统研究现状与发展方向[J]. 柴天佑. 中国科学:信息科学. 2016(08)
[6]基于自适应动态规划的储能系统优化控制方法[J]. 李相俊,张晶琼,何宇婷,惠东. 电网技术. 2016(05)
[7]具有未知动态的线性系统二人零和博弈问题在线学习方案[J]. 富月,柴天佑. 控制理论与应用. 2015(02)
[8]基于数据的自学习优化控制:研究进展与展望[J]. 刘德荣,李宏亮,王鼎. 自动化学报. 2013(11)
[9]线性Markov切换系统的随机Nash微分博弈及混合H2/H∞控制[J]. 朱怀念,张成科,王明亮. 控制与决策. 2013(08)
[10]自适应动态规划综述[J]. 张化光,张欣,罗艳红,杨珺. 自动化学报. 2013(04)
博士论文
[1]几类非线性奇异摄动系统的稳定性分析与控制[D]. 张艳.南京理工大学 2015
[2]基于近似动态规划的优化控制研究及在电力系统中的应用[D]. 秦春斌.东北大学 2014
硕士论文
[1]数据与模型混合驱动的双时间尺度系统次优控制[D]. 钟珊珊.中国矿业大学 2019
[2]工业过程多速率分层运行优化控制[D]. 陆文捷.中国矿业大学 2019
[3]自适应最优跟踪控制及在SCARA机器人系统应用[D]. 侯大为.昆明理工大学 2018
[4]自适应动态规划在电力系统中的应用研究[D]. 程亮.华中科技大学 2014
本文编号:3185810
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3185810.html