关于带递归效用的平均场最优控制问题的随机最大值原理

发布时间:2018-02-24 18:39

  本文关键词: 递归效用函数 平均场正倒向随机微分方程 Ekeland变分原理 完全耦合的平均场正倒向随机微分方程 出处:《山东大学》2017年硕士论文 论文类型:学位论文


【摘要】:Peng[1]在1998年提出一个重要的公开问题:"除了一些特殊情形,当f非线性依赖于z时相应的全局最大值原理是一个公开问题"。[2]和[3]研究了这个公开问题,但是他们所得到的最大值原理仍包含未知参数。公开问题的主要难点在于倒向随机微分方程(简记为BSDE)的生成元f(x,y,z,u)是非线性依赖于z的,这是无论在理论还是实际生活中都存在的一种典型状态。2015年Hu[4]最终解决了这个历时已久的公开问题。在Hu[4]的基础上,本文将结论推广至平均场情形,并考虑了完全耦合的部分可观测的平均场随机最优控制问题。本文主要分为两部分。第一部分,我们研究带递归效用函数的平均场最优控制问题的随机最大值原理。我们得到了带递归效用函数的平均场倒向随机微分方程(简记为MFBSDE)的变分方程,且得到了新的最大值原理。控制域不必为凸且MFBSDE的生成元可包含z。我们考虑如下状态方程:带递归效用的平均场随机最优控制问题为在可容许控制集μ[0,T]上最小化(2)式中的代价泛函J(u(·)),即找到最优控制u,使得我们的目的是得到最小化代价泛函时,最优控制u(·)所能满足的条件。我们的主要思想是利用Ekeland变分原理以及相应的伴随方程得到最优控制的必要条件。本部分的主要难点在于:(1)如何得到MFBSDE的二阶变分方程的具体形式(与[15]不同)。(2)关于z的变分方程的二次形式导致二阶伴随方程十分复杂。第二部分我们考虑了一种完全耦合的正倒向随机系统的部分可观测的平均场随机最优控制问题。在正向扩散系数不包含控制变量且控制域不必为凸的假设下,由Ekeland变分原理并利用针状变分法,我们得到庞特里亚金型的最大值原理,并且相关的伴随过程为平均场情形下的正倒向随机微分方程(简记为FBSDE)的解。而完全耦合的正倒向随机最优控制问题的一般最大值原理仍是一个公开问题。我们定义如下代价泛函:当系数满足Lipschitz条件、可积性条件和G-单调性条件时,方程(5)存在唯一解,其中正向扩散系数不包含控制。我们应用Ekeland变分原理及相应的伴随方程得到完全耦合情形下的部分可观测的平均场随机最大值原理。
[Abstract]:In 1998, Peng [1] put forward an important open problem: "except for some special cases, the corresponding global maximum principle when f nonlinear depends on z is an open problem." [2] and [3]. But their maximum principle still contains unknown parameters. The main difficulty of the open problem is that the generator of backward stochastic differential equation (BSDE) is nonlinear dependent on z. In 2015, Hu [4] finally solved this long-lasting open problem. On the basis of Hu [4], the conclusion is extended to the case of mean field. The stochastic optimal control problem of partially observable mean field is considered. This paper is divided into two parts. In this paper, we study the stochastic maximum principle for the mean field optimal control problem with recursive utility function. We obtain the variational equations of the mean field backward stochastic differential equation (MFBSDE) with recursive utility function. A new maximum principle is obtained. The control domain need not be convex and the generator of MFBSDE can contain z. we consider the following equation of state: the stochastic optimal control problem of mean field with recursive utility is minimized on the admissible control set 渭 [0T]. When we find the optimal control u, our aim is to obtain the minimized cost functional. Our main idea is to obtain the necessary condition of optimal control by using the Ekeland variational principle and the corresponding adjoint equation. The main difficulty of this part is how to get the second order variation of MFBSDE. The quadratic form of the variational equation for z (different from [15]) makes the second order adjoint equation very complicated. In the second part, we consider the partially observable plane of a fully coupled forward backward stochastic system. Under the assumption that the forward diffusion coefficient does not contain control variables and the control domain does not have to be convex, By using the Ekeland variational principle and the needle-like variational method, we obtain the maximum value principle of the Ponterria-gold type. And the associated adjoint process is the solution of forward backward stochastic differential equation (FBSDE) in the case of mean field. The general maximum principle of fully coupled forward backward stochastic optimal control problem is still an open problem. The following cost functional is defined: when the coefficient satisfies the Lipschitz condition, For the integrability condition and G-monotonicity condition, the equation has a unique solution. The forward diffusion coefficient does not contain control. By using the Ekeland variational principle and the corresponding adjoint equations we obtain the partially observable stochastic maximum principle of the mean field in the case of complete coupling.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O232

【相似文献】

相关期刊论文 前10条

1 丁俊堂;四阶非线性抛物方程的最大值原理[J];山西大学学报(自然科学版);2000年04期

2 李录;一类拟线性抛物型方程组的最大值原理[J];山西大学学报(自然科学版);1988年02期

3 丁俊堂;一类二阶拟线性抛物型方程的最大值原理[J];山西大学学报(自然科学版);1992年02期

4 吴臻,徐爱平;状态约束下完全耦合的正倒向随机控制问题的最大值原理[J];山东大学学报(自然科学版);2000年04期

5 门少平,罗学波;弱光滑系统与最大值原理[J];西北大学学报(自然科学版);2004年05期

6 张海燕;邓伟;王光臣;;部分可观测的完全耦合正倒向随机控制系统的最大值原理[J];应用数学;2007年02期

7 孙志强;杨海霞;齐立美;;最大值原理在渔业中的进一步分析[J];甘肃科学学报;2007年03期

8 李可柏;陈森发;赵禹骅;周小庄;;状态空间约束下一个最大值原理互补松驰强形式的分析[J];运筹学学报;2008年01期

9 叶仰明;群上的扫除原理和第二最大值原理[J];厦门大学学报(自然科学版);1984年04期

10 刘铁军;关于最大值原理和动态规划问题的几何性探讨[J];东北林业大学学报;1987年02期

相关会议论文 前5条

1 孙振东;李旭东;王建举;;广义跳变控制系统的最大值原理及应用[A];1993年控制理论及其应用年会论文集[C];1993年

2 郭磊;;确定性跳变系统的最大值原理[A];2007中国控制与决策学术年会论文集[C];2007年

3 楼红卫;;利用最大值原理研究最优控制存在性[A];第二十七届中国控制会议论文集[C];2008年

4 钱张军;;指标含控制全变差系统的最大值原理[A];1993年控制理论及其应用年会论文集[C];1993年

5 孙振东;王建举;;一类非光滑控制系统的最大值原理及应用[A];1992年中国控制与决策学术年会论文集[C];1992年

相关重要报纸文章 前1条

1 本报记者 姜范 彭实戈;发现数学里的美丽[N];经济日报;2009年

相关博士学位论文 前5条

1 许洁;时滞重随机控制系统的随机最大值原理及其应用[D];吉林大学;2017年

2 丁俊堂;若干非线性偏微分方程的爆破理论与最大值原理[D];山西大学;2006年

3 邢蕾;时滞带跳随机问题的最优控制理论研究[D];吉林大学;2012年

4 李书刚;微分方程的控制问题研究[D];华中师范大学;2004年

5 王光臣;部分可观测的随机控制系统及其应用[D];山东大学;2007年

相关硕士学位论文 前10条

1 郭翰橙;关于奇异平均场随机控制问题二阶随机最大值原理的研究[D];山东大学;2015年

2 刘冬梅;时标上二阶线性和非线性Δ%,

本文编号:1531306


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1531306.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1e299***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com