基于非合作动态博弈的随机切换系统能观性及优化控制
发布时间:2020-05-18 17:33
【摘要】:本文研究的是基于非合作动态博弈的随机切换系统的能观性和优化控制问题。这类系统是一个等级结构:包括一个领导者和有限多个跟随者。领导者制定自己的行动策略,跟随者之间就形成了可能存在纳什均衡的非合作动态博弈。同时这个随机切换微分博弈系统是一个由多子系统和特定切换规则构成的系统。这是一个从控制的观点来看动态博弈问题的新方向,同时也是一个将传统控制问题与博弈论相结合的新框架。论文首先研究了这类随机切换微分博弈系统的精确能观性问题。引入了代数Riccati方程,并通过构造Hamilton方程来将系统模型转化成易于分析处理的一般形式。随后通过线性算子理论和正倒向随机微分方程相关知识,构造系统观测器。这里的观测器不是一般意义上由Gram矩阵构成的,观测器的目的是为了得到随机切换微分博弈系统的对偶系统。然后,推理证明此类对偶的随机微分博弈系统的能观性判据。由得到的随机系统能观测判据,结合系统能观测的定义,给出随机系统能观性的应用,即证明了随机系统能观性、稳定性和Lyapunov方程的解之间的关系。其次,简要介绍了系统的经典二次型性能指标函数和跟随者最优控制。引入了两类优化控制问题:一是特殊的范数形式的线性二次型最优函数,并通过正倒向随机微分方程相关知识证明了此类优化控制的可解性和解的唯一性,并求解优化函数最小数值解。另一类则是引入了算子优化控制,研究算子的最小范数特征。然后,给出了随机系统能控性,能观性和最优控制的等价条件,并通过开环算子理论,倒向随机微分方程和伊藤公式给出相应证明。最后给出随机微分博弈系统在金融领域的一个实例,并对简单随机系统仿真分析。讨论了一个等级结构金融领域的最佳投资组合问题,一个投资人有预期的财富目标,两个投资经理在帮助投资人达到预期目标的前提下,有各自的利益最大化追求,即不同的价值指标泛函,并根据已知信息决定投资组合。对一个简单的随机系统分析,并通过推理证明设计控制器,并通过仿真验证可行性。
【图文】:
与此同时其他的子系统是停止工作的休眠状态。切换系统主要存在两种形式,逡逑一类被称作多子系统切换系统,是根据外部因素变化而改变自己工作模式的系统,逡逑如图1-2所示。逡逑上一级控制逡逑逦]邋[逦逡逑切决策单元h逦逡逑换邋逦逡逑信逡逑逦1邋号逡逑——H子系统1邋逦邋x^r逡逑——H子系统2邋|逦邋卜逦d邋输出邋|逦逦逦?逡逑——子系统N邋|—逦+逡逑图1-2多子系统切换模型逡逑Figure邋1-2邋Multi-subsystem邋switched邋model逡逑另一类如图1-3所示,如果在控制过程中,,单一的控制器不能保证系统达到规逡逑定的性能指标要求,可以通过选择控制器来达到预期结果的多控制器切换系统。逡逑由于加入了特定的切换规则,这类系统并不能单纯的看成是子系统之间的简逡逑单组合,它具有的各类动力学性质超出了简单叠加的效果。例如,因为切换信号的逡逑存在,如果子系统均不是稳定的,可以通过改变规则来保证整个系统的稳定性;若逡逑各子系统稳定,但切换时间或者规则不合适,也有一定概率会影响系统的稳定性W。逡逑切换系统在实际的工程系统和经济领域的应用研宄内容丰富,比如金融领域中的逡逑期权定价问题[5]和投资型保险的红利分发问题[
应用到很多实际的领域中,比如在金融、控制、计算机和通信网络等领域都有广泛逡逑应用。例如,D2D通信的功率控制算法问题[9】、博弈论在不同电力需求侧的博弈行逡逑为[1()](详细见图1-4)、并且在近两年很热的区块链[11]和物联网[12]方向也有相应研逡逑究。逡逑19世纪60年代,Isaacs第一次完成了有关微分博弈(Differential邋games)的成逡逑果发布之后,引起了科学工作者的广泛关注。那时微分博弈研究的主要是追逃、射逡逑击、对抗等军事理论相关问题。微分博弈即参与者进行博弈时,双方各自控制策略逡逑和的相互作用,可以通过由状态构成的微分函数来描述。当系统存在逡逑随机干扰变量时,随机微分博弈函数可以表示成如下形式:逡逑3逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:O225;TP13
本文编号:2670077
【图文】:
与此同时其他的子系统是停止工作的休眠状态。切换系统主要存在两种形式,逡逑一类被称作多子系统切换系统,是根据外部因素变化而改变自己工作模式的系统,逡逑如图1-2所示。逡逑上一级控制逡逑逦]邋[逦逡逑切决策单元h逦逡逑换邋逦逡逑信逡逑逦1邋号逡逑——H子系统1邋逦邋x^r逡逑——H子系统2邋|逦邋卜逦d邋输出邋|逦逦逦?逡逑——子系统N邋|—逦+逡逑图1-2多子系统切换模型逡逑Figure邋1-2邋Multi-subsystem邋switched邋model逡逑另一类如图1-3所示,如果在控制过程中,,单一的控制器不能保证系统达到规逡逑定的性能指标要求,可以通过选择控制器来达到预期结果的多控制器切换系统。逡逑由于加入了特定的切换规则,这类系统并不能单纯的看成是子系统之间的简逡逑单组合,它具有的各类动力学性质超出了简单叠加的效果。例如,因为切换信号的逡逑存在,如果子系统均不是稳定的,可以通过改变规则来保证整个系统的稳定性;若逡逑各子系统稳定,但切换时间或者规则不合适,也有一定概率会影响系统的稳定性W。逡逑切换系统在实际的工程系统和经济领域的应用研宄内容丰富,比如金融领域中的逡逑期权定价问题[5]和投资型保险的红利分发问题[
应用到很多实际的领域中,比如在金融、控制、计算机和通信网络等领域都有广泛逡逑应用。例如,D2D通信的功率控制算法问题[9】、博弈论在不同电力需求侧的博弈行逡逑为[1()](详细见图1-4)、并且在近两年很热的区块链[11]和物联网[12]方向也有相应研逡逑究。逡逑19世纪60年代,Isaacs第一次完成了有关微分博弈(Differential邋games)的成逡逑果发布之后,引起了科学工作者的广泛关注。那时微分博弈研究的主要是追逃、射逡逑击、对抗等军事理论相关问题。微分博弈即参与者进行博弈时,双方各自控制策略逡逑和的相互作用,可以通过由状态构成的微分函数来描述。当系统存在逡逑随机干扰变量时,随机微分博弈函数可以表示成如下形式:逡逑3逡逑
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:O225;TP13
【参考文献】
相关期刊论文 前2条
1 杨静;胡俊美;;布朗运动与随机积分的起源[J];咸阳师范学院学报;2015年02期
2 ;FORWARD-BACKWARD STOCHASTIC DIFFERENTIAL EQUATIONS, LINEAR QUADRATIC STOCHASTIC OPTIMAL CONTROL AND NONZERO SUM DIFFERENTIAL GAMES[J];Journal of Systems Science and Complexity;2005年02期
相关博士学位论文 前3条
1 曹铭;Markov机制转移环境下投资保险问题的随机微分博弈研究[D];广东工业大学;2017年
2 刘教;切换正系统的稳定性分析及控制综合[D];大连理工大学;2017年
3 于志勇;随机控制和对策理论中的一些倒向问题[D];山东大学;2008年
相关硕士学位论文 前2条
1 张婷瑞;随机切换系统的纳什均衡精确能控性及线性二次最优控制[D];北京交通大学;2017年
2 王朋澎;基于ELM的Markov跳跃随机非线性系统的神经网络控制研究[D];贵州大学;2017年
本文编号:2670077
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2670077.html