当前位置:主页 > 科技论文 > 自动化论文 >

模型自由的离散时间系统的随机线性二次最优控制

发布时间:2017-07-29 08:33

  本文关键词:模型自由的离散时间系统的随机线性二次最优控制


  更多相关文章: Q学习算法 值函数 随机线性二次最优控制 随机代数方程


【摘要】:针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q学习算法;其次给出Q学习算法的等价形式并证明其收敛性;最后通过一个仿真实例说明Q学习算法的有效性。
【作者单位】: 辽宁石油化工大学理学院;东北大学信息科学与工程学院;沈阳师范大学计算机与数学基础教学部;
【关键词】Q学习算法 值函数 随机线性二次最优控制 随机代数方程
【基金】:教育部基本科研业务项目(N140404004)
【分类号】:TP13
【正文快照】: 随机线性二次(SLQ)最优控制问题由W.M.Wonhan[1]首次提出,随后得到了迅速的发展[2-5]。SLQ最优控制问题的可解性等价于求解随机代数方程,文献[6]引入了一般化Riccati方程,充分论证了SLQ最优控制问题的可解性等价于一般化Riccati方程的可解性;文献[7]通过矩阵拉格朗日定理给出

【相似文献】

中国期刊全文数据库 前10条

1 杨朋松;孙秀霞;董文瀚;武杰;;一类不确定离散时间系统的积分滑模控制[J];控制与决策;2012年09期

2 戴冠中;离散时间系统的定常状态估计器[J];控制理论与应用;1984年02期

3 许庆山;;离散时间系统状态方程时域解的讨论[J];工科电工教学;1988年02期

4 周瑗;;计算机模拟离散时间系统卷积和求解过程[J];武测科技;1991年04期

5 王子栋,唐国庆;方差约束了不确定线性离散时间系统的鲁棒H_∞控制(英文)[J];控制理论与应用;1997年02期

6 史林杰;离散时间系统边界条件的确定准则[J];电工教学;1997年02期

7 王佐伟;吴宏鑫;;非线性离散时间系统的自适应模糊补偿控制[J];控制工程;2004年01期

8 赵亚丹;王亚慧;程培新;;离散时间系统变结构拟滑模控制改进算法[J];计算机仿真;2008年11期

9 林小峰;张衡;宋绍剑;宋春宁;;非线性离散时间系统带ε误差限的自适应动态规划[J];控制与决策;2011年10期

10 阮荣耀;多输入—多输出离散时间系统的辨识和最优控制设计的软件[J];信息与控制;1982年06期

中国重要会议论文全文数据库 前10条

1 郁文生;黄琳;;关于离散时间系统鲁棒严格正实镇定的几个问题[A];1998年中国控制会议论文集[C];1998年

2 李少远;曹保定;;离散控制系统数学模型的重新参数化[A];1994中国控制与决策学术年会论文集[C];1994年

3 戴浩晖;陈树中;汪志鸣;;非线性离散时间系统稳定性的李雅普诺夫方法[A];第二十四届中国控制会议论文集(上册)[C];2005年

4 马维海;王美春;盖如栋;;离散时间系统Δ调制的混沌动力学研究[A];2007'仪表,自动化及先进集成技术大会论文集(二)[C];2007年

5 阮荣耀;李勇智;潘仁良;毕平;;控制方向未知的离散时间系统的自适应调节[A];2006中国控制与决策学术年会论文集[C];2006年

6 陈宁;桂卫华;张小峰;;具有范数界参数不确定性多通道离散时间系统的鲁棒分散H_∞控制[A];第二十四届中国控制会议论文集(下册)[C];2005年

7 魏丽霞;崔宝同;李向丽;;一种离散时间系统变结构控制的方法[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年

8 郝飞;楚天广;黄琳;;离散时间系统混合l_1/H_∞-控制问题[A];第二十届中国控制会议论文集(上)[C];2001年

9 朱尚伟;伍镜波;;Hilbert空间上缠结离散时间系统的稳定性[A];第二十届中国控制会议论文集(下)[C];2001年

10 陈彭年;韩正之;;C*代数上离散时间系统的镇定[A];1993中国控制与决策学术年会论文集[C];1993年

中国博士学位论文全文数据库 前2条

1 黄淼;非线性离散时间系统多模型自适应控制策略研究[D];华东理工大学;2015年

2 韩士元;含有控制时滞离散时间系统的最优控制及其应用研究[D];中国海洋大学;2012年

中国硕士学位论文全文数据库 前10条

1 范一心;多时滞离散时间系统跟踪控制[D];浙江工业大学;2015年

2 韩秀梅;两类离散时间系统的事件触发控制[D];东北大学;2014年

3 刘凯;一般非线性离散时间系统的输入到状态稳定性研究[D];郑州大学;2008年

4 王晶晶;基于PCGSHF的离散时间MIMO系统零点稳定性研究[D];重庆大学;2010年

5 李俊领;离散时间系统直接型与鲁棒混杂间接型模型参考自适应控制[D];曲阜师范大学;2006年

6 孙娜娜;不确定离散时间系统滑模控制研究[D];华东理工大学;2013年

7 张德霞;离散时间系统自适应迭代学习控制中的几类问题研究[D];青岛科技大学;2014年

8 李平;线性离散时间系统的鲁棒自适应控制方法研究[D];曲阜师范大学;2014年

9 罗刘敏;离散时间系统滑模变结构控制理论若干问题研究[D];东北大学;2009年

10 李慧珍;不确定时变时滞非线性离散时间系统的鲁棒H_∞控制[D];辽宁科技大学;2013年



本文编号:588293

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/588293.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eeb7b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com