合作微分博弈问题研究

发布时间：2020-03-20 22:41

【摘要】： 微分博弈论的起源可追溯于20世纪40年代。1965年,随着Isaacs写成《微分博弈》这部经典之作,以及贝尔曼(Bellman,1957)的《动态规划》和庞特里亚金(Pontryagin,1962)的《最优过程的数学理论》,确定性微分博弈理论得以奠基。然而在诞生之初,微分博弈主要作为控制理论的研究拓展,且较多应用于航空、航海和军事领域。随着时光推移,更多的学者开始关注并深入研究微分博弈,并用不懈的努力推动博弈理论向高级形式的进化,挑战应用数学理论等级制度中经典理论处于最底层的成规。近三十年来,博弈论已经形成了一个完整的理论体系,博弈论思想和方法亦逐渐成为主流经济学的重要分析范式,其应用范围涵盖整个经济学领域,并逐步向社会学、生物学、物理学等社会科学与自然科学拓展。当今经济社会的重要特征是高度的生产专门化和经营协作化,由对抗走向合作,由竞争转为协同已经成为各个经济主体的共识,大到主权国家与国际经济合作组织,小到微观厂商或经济个体,都非常重视合作与协同发展。许多对于经济合作问题的分析和解释都是建立在合作博弈理论基础上的。然而,现实中的经济合作问题并非如静态合作博弈模型所刻画与解释的一样,由于时间的流逝进展及经济决策主体周遭环境的变迁,静态框架下的最优均衡也许不再适用,无法保证经济合作的顺利进行。合作微分博弈理论能够为解决这个问题提供一条有效途径。合作微分博弈可以理解为在连续时间维度内,由拥有无限可供选择策略,追求整体理性和个体理性的合作参与者瞬时作出的,能够直接影响其他所有参与者的行为互动。静态合作博弈要求存在具有约束力的合作协议,并具有明确的整体支付分配方案,其强调满足整体理性下的公平和效率。而将时间因素及无限策略引入静态合作博弈后,在静态环境中具有约束力的协议的前提条件下,必须同时满足由最初协议指定的均衡解法必须满足时间一致性,原因在于,微分博弈本身要求其均衡解法必须时间一致的,即满足子博弈一致性。由此,一个合作微分博弈的均衡解法,必须满足时间一致性,保证所有参与者沿着最优状态轨迹,按照最初共同制定的最优准则下的分配方案,持续合作,每个时刻都不发生偏离,直至合作结束。但这里仅提出了一个分配作为合作微分博弈均衡解法的必要条件,必须制定一种能确保实现这一分配方案的机制,从而保证合作顺利进行,亦即只有此机制的保障下,作为均衡解法的分配方案才有意义。文章题为《合作微分博弈问题研究》,旨在对合作微分博弈理论进行深入研究后,就制定一种满足时间一致性,且能够保证最优准则下的分配方案得以持续有效的支付分发机制,提出几点具有价值的建议。对于最初共同制定的最优准则不做展开研究,仅将研究重点置于在最优准则既定条件下,如何时间一致地实现由最优准则确定的分配方案。将此种机制应用于实践,分析和解释经济现象,处理经济问题,将合作微分博弈理论与现实经济活动紧密联系。首先从时间连续性及策略无限性角度定义了微分博弈,并在此基础上证明了微分博弈纳什均衡的存在性。给出了合作微分博弈的结构,并对其基本元素的经济学含义做了深入分析和解释。并讨论了共态变量、汉密尔顿函数和横截条件的经济学解释。同时给出了非合作微分博弈均衡解法的时间一致性准则,在此基础上又给出了合作微分博弈均衡解法的时间一致性准则,即时间一致性确保贯彻整个合作博弈,整体理性和个体理性都得到维持,且沿着博弈的最优状态轨迹,在当前开始的合作博弈的分配方案,即使应用于随后开始的合作博弈,仍然为最优。然而,合作的成功不仅要求其均衡解法的时间一致性,同时也要求必须有能够确保此时间一致性的机制。应用合作微分博弈均衡解法的时间一致性准则,文章引入了带有“瞬时平衡得偿”的“支付分发机制”,旨在利用这种机制,保证最初共同制定的最优准则下的均衡分配方案满足时间一致性,并持续有效,从而确保合作顺利进行。支付分发机制由瞬时平衡得偿与最优终点支付构成,前者即为参与者的瞬时所得,是一种双向的支付流动。而对于“分发”的理解,应从联盟层面上升到“自然”的高度。联盟价值是时时创造的,同样支付也是时时分配的。这即是“自然”在博弈的每个时刻,从联盟所有成员处汇总创造的价值的同时,瞬间将其分发回联盟成员的手中,当然“自然”分发行动的准则即为最初由所有联盟参与者共同锁定的最优准则。“自然”的分发行为建基于既定的最优准则,是时间一致的；同时最优准则规制的每个分配,也因为“自然”这个特殊的分配主体,亦为时间一致。同时,归纳了文章中给出的支付分发机制与Yeung和Petrosyan (2005)针对随机微分合作设计的分配程序的四点差别,即基本思想不同、研究框架及使用技术的差异、对于最优终点支付的处理有异以及对结论的检验不同。证明了可实现时间一致性分配的支付分发机制必须满足：(1)沿着最优轨迹的每个时点,参与者的得偿总和等于双方在使用最优合作策略时的瞬时支付总和；(2)参与者在任意时间区间内所分得的瞬时平衡得偿总和的现值与其终点支付的现值之和,不少于其在非合作情况下的价值函数；(3)沿着博弈的最优轨迹,参与者在任意时点开始的博弈中所分得的支付都等于,其在随后某一时点开始的另一个博弈中所分得的支付的现值,加上其在当前博弈与后来博弈之间所收到的所有瞬时平衡得偿的现值。而最优状态在两个极其接近的时点的变化进展等于状态的瞬时变化。为了更好的理解瞬时平衡得偿,在二人合作的框架下分析了其内在含义及经济学解释。合作参与者在任意时点获得的瞬时平衡得偿为三项总和：其一,根据最初制定的最优准则,参与者从整体合作支付中分得的边际部分；其二,根据最初制定的最优准则,参与者从以下两项中所得,分别为：其自身的非合作支付的边际部分；当此时的最优状态动态系统由非合作路径转至合作路径时,对其非合作支付的瞬时影响；其三,根据最初制定的最优准则,参与者从以下两项中所得,分别为：对手参与者的非合作支付的边际部分；当时最优状态动态系统由非合作路径转至合作路径时,对对手参与者非合作支付的瞬时影响。在研究了支付可转移博弈后,考虑了支付不可转移情况下的整体理性,证明了帕累托有效控制的特征。在二人博弈情况下,帕累托边界可以被宽泛的视为一个递减函数。证明了一般非凸博弈中的帕累托最优均衡存在性的必要条件。并通过一个联合广告开发的实际经济问题做了深入分析和探讨。同时,研究了微分博弈中的个体理性——时间一致性和合意性。证明了时间一致性和合意性的条件,若状态增加一单位,则参与者的个体支付的增加数量,无论在合作情况下还是在非合作情况下,都是一样的；若在博弈的初始阶段采取合作方式是满足个体理性的,则合作将一直是个体理性的；若合作解法是时间一致性的,则其亦为合意的。文章将理论紧密联系实际经济问题,重视理论对现实经济问题的分析和解释能力。建立了技术联盟的合作微分博弈模型,研究并设计技术联盟的支付分发机制,并通过Matlab程序验证了此机制能够保证分配方案的时间一致性。认为技术联盟中成员收益分配是影响技术联盟正常运行和稳定发展的关键因素,通过建立两个合作微分博弈模型,分别研究具有两个参与者和多个参与者的技术联盟。针对二人技术联盟问题,设计一套支付分发机制,使纳什讨价还价均衡分配准则得以一直维持,确保达成稳定的合作计划；针对三人技术联盟问题,规划了一种带有瞬时平衡得偿的支付分发机制,使动态沙普利值得以被一直执行,确保三方达成时间一致的合作方案。文章的主要成果可以归纳三点。其一,从时间连续性和策略无限性双重角度定义了微分博弈；其二,引入带有“瞬时平衡得偿”的“支付分发机制”,并将其作为确保合作最优准则持续被遵循,合作计划自始至终有效持续的保障机制,由此机制给出的合作微分博弈分配解法满足时间一致性,从而确保了合作的成功；其三,构建了技术联盟的合作微分博弈模型,设计能够实现时间一致性分配的支付分发机制；并通过Matlab程序进行模拟分析,验证了结论的合理性。
【学位授予单位】：东北财经大学
【学位级别】：博士
【学位授予年份】：2009
【分类号】：F224.32

【参考文献】