当前位置:主页 > 理工论文 > 系统学论文 >

基于数据驱动的离散广义系统的近似动态规划

发布时间:2020-09-02 11:29
   本文研究基于数据驱动的一类线性广义系统的最优控制方法。广义系统模型存在于社会生产的诸多领域中,如电力系统、石油化工、经济领域、机器人系统、通讯网络以及航天航空系统等。随着广义系统理论研究的不断深入,它成为现代控制理论的一个独立的分支。广义系统相对于以标准微分方程或差分方程描述的动态系统(正常系统),具有更一般的形式。特别是当由其系统内部结构决定的系统指标参数(index)大于1时,系统会存在潜在的脉冲行为。这一点为广义系统的相关理论研究带来了很大的困难,同时带来了很大的挑战。 近年来,由于计算机技术的发展,使得数据易于存储和处理。这使得基于数据的控制方法易于实现。基于数据驱动的控制方法适用于受控系统的全局模型未知或受控过程结构变化很大的动态系统。这种控制方法通常是只通过的输入输出数据来为目标系统设计控制器。这一特点,使得这一类控制方法更加灵活,适用范围也更广泛。 本文的主要创新点是给出了离散广义系统的基于数据驱动的最优控制方法。首先,由系统的能控性与能观测性等系统特性得到了不显式含有系统状态的控制器设计方案。其次,得到了一个只与输入、输出数据有关,而与系统状态和系统矩阵无关的控制器设计方法。所得控制器是由系统的输入和输出数据构成的自回归滑动平均模型(ARMA)。最后,在上述理论分析的基础上,给出了值迭代(VI)和策略迭代(PI)两类算法,并详细地讨论了算法的求解过程。仿真示例表明本文所提出的算法,不仅适用于系统index小于1的情形,同时也适用于index大于1的情形。
【学位单位】:辽宁科技大学
【学位级别】:硕士
【学位年份】:2013
【中图分类】:N941.1;O232
【部分图文】:

示意图,动态规划,示意图


态规划法的基本理论态规划是一种解决动态规划问题非常有效的方法。自技术就属于近似动态规划。而其中的加强学习主要包括分算法、蒙特卡罗算法以及 Q 学习方法等。P.J.Werb动态规划方法,这个方法的最重要的目的是获得最优控此方法是为逼近动态规划过程中的性能指标函数以及控似结构方程,从而达到了最优性原理的要求。态规划的基本过程如图 2 所示:

系统结构图,迭代学习控制,系统结构图,R表示


辽宁科技大学硕士学位论文制过程中的控制输入和误差信息,受控对象为全局的李普希兹连续( 1) ( ( ), ( ), )( ) ( ( ), ( ), )i i ii i ix k f x k u k ky k g x k u k k+ ==其中, f ,g 为具有相应维数的向量函数, ( )nix k ∈ R代表系统( )mk ∈ R表示系统的输出向量, ( )iru k ∈ R表示为控制的输入向量

迭代学习控制,基本原理


)以系统的输出数据作为控制对象,即不受系统状态任何信息的影响;)控制器的结构比较简单,减小了计算过程的复杂程度;)控制过程具有存储功能;)控制器的设计对系统知识的要求不高,被控对象直接从系统出发;)初始条件假设在迭代学习过程起到非常重要的作用;)在所要做的迭代过程中,系统的期望轨迹是一致的。k T k T k TiNe i 1eieiNu i 1uiu

【参考文献】

相关期刊论文 前1条

1 侯忠生;许建新;;数据驱动控制理论及方法的回顾和展望[J];自动化学报;2009年06期



本文编号:2810536

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/xtxlw/2810536.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户68923***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com