有限博弈的空间结构分析及其在设备系统的优化与控制问题中的应用
发布时间:2021-11-29 01:50
有限势博弈作为一类特殊的博弈具有许多优良的性质,特别是纯纳什均衡的存在性和演化下纳什均衡的可达性这两个特性,使它备受青睐.势博弈在博弈理论中占据着非常重要的位置,尤其是在近几年发展的博弈控制论中,作为支付设计和学习规则设计这两个步骤的接口,在分布式系统的优化与控制问题中起着非常关键的作用.本文主要利用势博弈的静态和动态性质,借助矩阵的半张量积这一数学工具,一方面将设备系统等价转化为有限势博弈,从而通过优化势函数实现系统的的分布式优化与控制;另一方面将有限博弈空间看成与其具有相同拓扑结构和向量空间结构的欧几里得空间,从而在线性代数框架下分析有限博弈的空间结构.本文主要研究了反对称博弈、对称博弈和具有对称势的有限博弈的空间结构问题,基于博弈控制论的单目标和多目标设备系统的优化与控制问题,以及连续势函数的数值解问题.具体研究内容如下:1.研究了单目标设备系统的分布式优化与控制问题.给出拥塞博弈的矩阵表示,并以此为基础,给出使设备系统能够成为拥塞博弈且以性能指标函数为其势函数的充分必要条件和设备支付函数的设计方法.同时,分析了策略局势动态方程为马尔可夫过程的动态系统的动态行为.进一步,将研究方...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:170 页
【学位级别】:博士
【部分图文】:
图1.2:各主要章节逻辑结构图??第六章研宄具有对称势的有限博弈的空间结构问题.第二节给出了验证对??
第三章基于拥塞博弈方法的协同控制??应这一策略更新规则后,两种设备支付函数下的两个动态系统具有相同??的策略局势动态凡/2和/3,具体如表3.4所示.根据定义3.1可知,这两??个博弈是动态等价的.因此,如果一个设备系统的设备支付函数为三,反??常性能指标函数为昃则它至少有一个纯纳什均衡.??进一步,对设备支付函数为三的设备系统,采用短视最优响应进行策??略更新时,其策略局势动态方程可表示为如下切换系统:??x(t.?+?1)?=?Lcx(t),?a?£?{1,2,3}?(3.25)??其中??U?=?<Ji8[l〇,?2,3,4,5,6,7,17,9,10,2,3,4,5,6,7,17,9],??L2?=?<518[7,5,6,7,5,6,7,5,6,16,14,18,16,14,18,16,14,18],??1%?=?<5i8[3,?3,3,?5,5,5,9,9,9,12,12,12,14,14,14,18,18,18].??现在,假设在Matlab仿真中选择每个系统的概率为^并随机选取三??个初始点,则局势动态演化过程如图3.1所示.分析该图可以看出,从??任意一个初始点出发的动态系统最终都会收敛到唯一的纳什均衡,即??也?{1,2,2}.??r?t\??;???言????I?*?6?I?馨?3?22M2?2t??图3丄(3.25)的局势动态演化过程??最后,假设c?=?0.9.容易计算,??IIP?—?/^||?:=?max?|P⑷一?P〇(a)|?=?0.8315?<?e.?(3.26)??a£A??37??
图4.1:需求关系??
【参考文献】:
期刊论文
[1]Nonsingularity of Grain-like cascade FSRs via semi-tensor product[J]. Jianquan LU,Meilin LI,Yang LIU,Daniel W.C.HO,Jrgen KURTHS. Science China(Information Sciences). 2018(01)
[2]A survey on applications of semi-tensor product method in engineering[J]. Haitao LI,Guodong ZHAO,Min MENG,June FENG. Science China(Information Sciences). 2018(01)
[3]The Computation of Nash Equilibrium in Fashion Games via Semi-Tensor Product Method[J]. GUO Peilian,WANG Yuzhen. Journal of Systems Science & Complexity. 2016(04)
[4]Semi-tensor product approach to controllability and stabilizability of finite automata[J]. Yongyi Yan,Zengqiang Chen,Zhongxin Liu. Journal of Systems Engineering and Electronics. 2015(01)
[5]How cooperation arises from rational players?[J]. MU YiFen,GUO Lei. Science China(Information Sciences). 2013(11)
[6]Semi-tensor product of matrices and its application to Morgen’s problem[J]. 程代展. Science in China(Series F:Information Sciences). 2001(03)
本文编号:3525595
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:170 页
【学位级别】:博士
【部分图文】:
图1.2:各主要章节逻辑结构图??第六章研宄具有对称势的有限博弈的空间结构问题.第二节给出了验证对??
第三章基于拥塞博弈方法的协同控制??应这一策略更新规则后,两种设备支付函数下的两个动态系统具有相同??的策略局势动态凡/2和/3,具体如表3.4所示.根据定义3.1可知,这两??个博弈是动态等价的.因此,如果一个设备系统的设备支付函数为三,反??常性能指标函数为昃则它至少有一个纯纳什均衡.??进一步,对设备支付函数为三的设备系统,采用短视最优响应进行策??略更新时,其策略局势动态方程可表示为如下切换系统:??x(t.?+?1)?=?Lcx(t),?a?£?{1,2,3}?(3.25)??其中??U?=?<Ji8[l〇,?2,3,4,5,6,7,17,9,10,2,3,4,5,6,7,17,9],??L2?=?<518[7,5,6,7,5,6,7,5,6,16,14,18,16,14,18,16,14,18],??1%?=?<5i8[3,?3,3,?5,5,5,9,9,9,12,12,12,14,14,14,18,18,18].??现在,假设在Matlab仿真中选择每个系统的概率为^并随机选取三??个初始点,则局势动态演化过程如图3.1所示.分析该图可以看出,从??任意一个初始点出发的动态系统最终都会收敛到唯一的纳什均衡,即??也?{1,2,2}.??r?t\??;???言????I?*?6?I?馨?3?22M2?2t??图3丄(3.25)的局势动态演化过程??最后,假设c?=?0.9.容易计算,??IIP?—?/^||?:=?max?|P⑷一?P〇(a)|?=?0.8315?<?e.?(3.26)??a£A??37??
图4.1:需求关系??
【参考文献】:
期刊论文
[1]Nonsingularity of Grain-like cascade FSRs via semi-tensor product[J]. Jianquan LU,Meilin LI,Yang LIU,Daniel W.C.HO,Jrgen KURTHS. Science China(Information Sciences). 2018(01)
[2]A survey on applications of semi-tensor product method in engineering[J]. Haitao LI,Guodong ZHAO,Min MENG,June FENG. Science China(Information Sciences). 2018(01)
[3]The Computation of Nash Equilibrium in Fashion Games via Semi-Tensor Product Method[J]. GUO Peilian,WANG Yuzhen. Journal of Systems Science & Complexity. 2016(04)
[4]Semi-tensor product approach to controllability and stabilizability of finite automata[J]. Yongyi Yan,Zengqiang Chen,Zhongxin Liu. Journal of Systems Engineering and Electronics. 2015(01)
[5]How cooperation arises from rational players?[J]. MU YiFen,GUO Lei. Science China(Information Sciences). 2013(11)
[6]Semi-tensor product of matrices and its application to Morgen’s problem[J]. 程代展. Science in China(Series F:Information Sciences). 2001(03)
本文编号:3525595
本文链接:https://www.wllwen.com/kejilunwen/yysx/3525595.html