正倒向随机系统的微分博弈、数值逼近及最优保费应用
发布时间:2020-09-15 20:01
本论文主要讨论正倒向随机微分方程系统下的随机微分博弈、解的数值逼近及最优保费中的应用问题。论文包括以下四个部分:第一部分研究含脉冲控制的正倒向随机系统非零和微分博弈问题,得到了其最大值原理及验证定理;第二部分研究非对称信息下线性二次非零和微分博弈问题,得到了几类非对称信息框架下微分博弈问题的纳什均衡点;第三部分我们应用分支粒子系统给出了一类耦合的正倒向随机微分方程解的数值逼近,并证明了其收敛性和收敛速度;第四部分研究了一个保险公司的最优保费问题,我们显式地给出了最优保费策略及相应的最优指标泛函,并给出了数值模拟来解释理论结果。下面将进一步介绍论文的内容及结构。第一章,对论文所研究问题的相关历史文献作一个简要回顾。第二章,我们研究一类非零和随机微分博弈问题的最大值原理和验证定理,其中博弈系统是由正倒向随机微分方程系统驱动的,控制变量由两部分组成:连续控制变量和脉冲控制变量。通过分别对两部分控制变量使用凸变分,我们得到了该博弈系统开环纳什均衡点的最大值原理形式的必要性条件。另外,我们还得到了充分性均衡条件,用于帮助找到纳什均衡点。最后,我们将该理论结果应用于一个基金管理问题中,并显式得到了最优投资组合和最优脉冲消费策略。本章结果发表于论文:D. Chang and Z. Wu, Stochastic maximum principle for non-zero sum differen-tial games of FBSDEs with impulse controls and its application to finance, Journal of Industrial and Management Optimization, Vol.11 (2015),27-40.第三章,我们研究一类非对称信息下线性二次(简称LQ)非零和微分博弈问题。与已有的研究结果相比,本研究工作的一个突出特色在于参与者可得的信息是非对称的。通过最大值原理和完全平方的技巧,我们得到了几类非对称信息框架下微分博弈问题的纳什均衡点。在证明过程中,我们引入了一些Riccati方程和正倒向随机滤波方程,并证明了方程解的存在唯一性。最后,借助Riccati方程的解,我们将每一类非对称信息下博弈问题的唯一纳什均衡点表示成状态过程最优滤波的反馈形式。本章结果发表于论文:D. Chang and H. Xiao, Linear quadratic nonzero sum differential games with asym-metric information, Mathematical Problems in Engineering, vol.2014, Article ID 262314, 11 pages,2014.第四章,我们将利用随机环境下的分支粒子系统,给出一类耦合的正倒向随机微分方程解的新的数值格式。首先,借助四步法,我们引入一个偏微分方程来表示正倒向随机微分方程系统的解。然后,我们分别建立有穷和无穷粒子系统来表示该偏微分方程的近似解,其中每个粒子的位置和权重各自满足由原正倒向随机微分方程系统推导出的新的随机微分方程。最后,我们建立一个分支粒子系统来定义原正倒向随机微分方程系统的近似解。每个粒子的分支机制依赖于该粒子在短暂存活时间∈=n-2α内的路径,其中n表示初始粒子数目,α1/2是固定参数。关于该数值格式的收敛性和收敛速度我们也给出了证明。本章结果完成论文:D. Chang, H. Liu and J. Xiong, A branching particle system approximation for a class of FBSDEs, Journal of Mathematical Analysis and Applications, submitted.第五章,我们研究一个保险公司的最优保费问题,保险公司可以通过调整其保费费率来控制公司的现金余额。公司目标是通过收取合适的保费金额使得公司的现金余额关于预设目标的方差、保费策略的经营成本及一般的递归效用最小化。我们研究的问题有三个突出的特色:1.完全信息和部分信息的情形都做了研究;2.状态含终端约束;3.通过引入一般的随机递归效应,我们的最优化问题建立在正倒向随机微分方程的框架下。最终,我们显式地给出了最优保费策略及相应的最优指标泛函,并给出了数值模拟来解释理论结果。本章结果完成论文:D. Chang and Z. Wu, Optimal premium policy driven by FBSDEs under full and partial information, working paper.下面我们给出本论文的主要结论。1.含脉冲控制的正倒向随机系统非零和微分博弈的最大值原理我们考虑下列含脉冲控制的非零和微分博弈的正倒向随机微分方程*简称FBSDE)系统:其中b:[0,T]×Rn×Rk1×Rk2→Rn,σ:[0,T]×Rn×Rk1×R2→Rn×d,f:[0,T]×Rn×Rm× Rm×d×Rk1×Rk1→Rm,g:Rn→Rm是可测映射,C1:[0,T]→Rn×d1,G2:[0,T]→Rm×d1, D1:[0,T]→Rn×d2,D2:[0,T]→Rm×d2是连续函数。v1(·)和u2(·)是参与者1和参与者2的连续控制过程。η1(·)和η72(·)是参与者1和参与者2的脉冲控制过程。接下来我们引入代价泛函:Ji(v1(·),v2(·),η1(·),η2(·))其中φi:Rn→R,ri:Rm→(i=1,2)和hi:[0,T]×Rn×Rm×Rm×d×Rk1×Rk2→R(i=1,2)是给定的可测映射。假设每个参与者都希望通过选择合适的容许控制(vi(·),ηi(·))(i=1,2)来最大化他自己的代价泛函Ji(v1(·),v2(·),η1(·),η2(·)),则我们的问题是找到一组容许控制(v1(·),ζ1(·), v2(·),ζ(·))∈A1×A2使得我们称这一问题为含脉冲控制的正倒向非零和随机微分博弈。这一部分的主要结果是如下定理:定理2.1.假设(H2.1)和(H2.3)成立。令(v1(·),ζ1(·),v2(·),ζ2(·))∈A1×A2是前述博弈问题的一个纳什均衡点,(x(·),y(·),z(·))是相应的状态轨迹,(pi(·),qi(·),ki(·))(i=1,2)是伴随方程(2.26)的解。则对(?)v1∈U1,v2∈U2,η1(·)∈K1和η2(·)∈K2,有H1v1(t,x(t),y(t),z(t),v1(t),v2(t),p1(t),g1(t),k1(t))(v1-v1(t))≤ 0 a.e.,a.s., (2.2.10) H2v2(t,x(t),y(t),:(t)v1(t),u2(t),p2(t),q2(t),k2(t))(v2-v2(t))≤0 a.e.,a.s., (2.2.12)定理2.2.假设(H2.1)-(H2.3)成立。假设函数φi,γi,ηi→(t,ηi)和(x,y,z,v1,v2)→ Hi(t,x,y,z,v1,v2,pi,qi,ki)(i=1,2)是凸的。对于K∈Rm×n和ξ∈L2(Ω,FT,P;Rm),yv1,v2,η1,η2 (T)=Kxv1,v2,η1,η2(T)+ξ,(v1(·),η1(·),V2(·),η2(·))∈A1×A2.令(pi,qi,ki)(i=1,2)是关于(v1,ζ1,v2,ζ2)∈A1×A2伴随方程的解。若(u1,ζ1,u2,ζ2)满足(2.2.10),(2.2.11),(2.2.12)和(2.2.13),则其为含脉冲控制正倒向非零和随机微分博弈的一个纳什均衡点。2.非对称信息下线性二次非零和微分博弈在这一部分我们研究非对称信息下线性二次非零和微分博弈问题。为了简便,我们只考虑两个参与者的情形。考虑下列一维SDE代价泛函的形式为其中a,b1,b2,c,e,g1,g2和93是关于t的有界确定性函数,l1和l2是关于t的有界非负确定性函数,m1和m2是关于t的有界正确定性函数,r1和r2是两个非负常数。为了记号简便,在不会混淆的情况下,我们删掉所有过程和确定性函数记号中表示依赖于时间变量的t.u1(·)和u2(·)分别是参与者1和参与者2的控制过程。我们总是使用下标1(相应的,下标2)来刻画与参与者1(相应的,参与者2)相关的控制变量,并使用xu1,u2来表示状态依赖于控制变量(u1.u2).令Ft表示t时刻的完全信息,gti(?)Ft是给定的子域流,表示参与者i(i=1,2)在t∈[0.T]时刻可得的信息。如果gti(?)F且gti≠Ft,我们称参与者i的可得信息是部分信息或不完备信息。若gt1≠gt2,我们称参与者1和参与者2的可得信息非对称。我们将研究以下四类非对称信息下的问题:(i)gt1=Ft1,2和gt2=Ft2,3,即,两个参与者掌握共同的部分信息Ft2;(ii)gt1=Ft1,2和gt2=Ft2,即,参与者1比参与者2掌握更多的信息;(iii)gt1=Ft和gt2=Ft2,即,参与者1掌握完全信息而参与者2掌握部分信息;(iv)gt1=Ft1,2和gt2=Ft3,即,两个参与者掌握的信息相互独立假设每个参与者都希望通过选择合适的容许控制ui(·)(i=1,2)来最小化他/她自己的代价泛函Ji(u,(·),u2(·)).本章的研究工作中,我们的问题是,在非对称信息的设置下,找到(v1,(·),v2(·)) ∈v1×v2其被称为博弈问题的纳什均衡点,使得我们称上述问题为非对称信息下线性二次非零和微分博弈问题。为了简便,我们用问题(LQNZSDG)来表示。这一部分的主要结果是如下定理:定理3.1.(u1,u2)是问题(LQNZSDG)的纳什均衡点当且仅当(u1,u2)满足(3.3.8)且(x, (y1,z11,z12,z13),(z2,z21,z22,z23))满足FBSDE (3.3.9).分别考虑四类非对称信息下的情形。情形1:gt1=Ft1,2且gt2-Ft2.3.定理3.1可如下重写为:定理3.2.(u1,u2)是问题(LQNZSDG)的纳什均衡点当且仅当(u1,u2)满足如下形式:其中(x,(y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解我们推导出纳什均衡点,其被表示成状态x的最优滤波x,x和x的反馈。定理3.4.在假设(H3.3)下,问题(LQNZSDG)有唯一的纳什均衡点,表示为其中x,x和x分别表示为(3.3.32),(3.3.40)和(3.3.45),γi和Ti(i=1,2,3)分别由系统(3.3.37)和(3.3.43)唯一确定。情形2:gt1=Ft1,2,且gt2=Ft2.我们得到下列定理定理3.5.(u1,u2)是问题(LQNZSDG)的纳什均衡点当且仅当其中(x, (y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解定理3.6.若(H3.3)成立,则问题有唯一的纳什均衡点表示为(LQNZSDG)其中x和x分别表示为(3.3.32)和(3.3.40).情形3:gt1=Ft且gt2=Ft2.我们有下列定理定理3.7.(u1,u2)是问题的纳什均衡点当且仅当(LQNZSDG)其中是下列FBSDE的解(x,(y1,z11,z12,z13),(y2,z21,z22,z23))定理3.8.在假设(H3.3)下,问题有唯一的纳什均衡点表示为其中x和x分别表示为(3.3.32)和(3.3.52).(LQNZSDG)情形4:gt1=Ft1,2且gt2=Ft3.我们有下列定理定理3.9.(u1,u2)是问题的纳什均衡点当且仅当(LQNZSDG)其中(x,(y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解定理3.11.在假设(H3.3)和(H3.4)下,问题(LQNZSDG)有唯一的纳什均衡点表示为其中Ex,x和x分别表示为(3.3.59,),(3.3.61)和(3.3.63),γi和Ti(i=1,2,3)分别由系统(3.3.37)和(3.3.43)唯一确定,其中e(·)被0代替。3.一类正倒向随机微分方程的分支粒子系统逼近我们考虑下列固定时间区间[0,T]内的正倒向随机微分方程:其中b:Rd×Rk→Rd,σ:Rd→Rd×l,g:Rd×Rk×Rk×l→Rk及f:Rd→Rk.接下来,我们做出如下假设:假设(H4.1):g满足如下形式:对z=(z1…,z1),b(x,y),σ(x),g(x,y,z),f(x),C(x,y)和D(x,y)都是有界Lipschitz连续映射且二阶偏导数有界。借助四步法的思想,我们知道上述FBSDE的解满足关系Y(t)=u(t,X(t)),Z(t)= (?)xu(t,X(t))σ(X(t))其中u(t,x)是下列PDE的解其中且aij=(σσ*)ij,σ=(σ1,…σl),bi是b的第i个分量。对0≤t≤T,假定v(t,x)=v(T-t,x).可知该非线性抛物型偏微分方程(4.1.2)可以被写作:我们构建一个无穷粒子系统{Xi(t):i∈N)},其在Rd中的位置和随时间变化的权重{Ai(t):j∈N}满足下列方程:对0t≤T,i=1,2,其初始值{Xi(0),Ai(0),i∈N}独立同分布,{Bi(t),i∈N}是独立的标准布朗运动且对任意φ∈Cb2(Rd).我们得到定理4.2.粒子系统(4.1.4)的解是唯一的,其密度函数是偏微分方程(4.1.3)的解。下而引入一个有穷粒子系统来得到近似解:对固定的δ0,t∈(0,T],其中i=1,2,……n,给定初始值为定理4.3.un,8(t)到u(t)的收敛被界住。我们注意到上面定理4.3中的KT随着T增长是指数增长的,于是,逼近误差会快速地指数增长。为了避免数值格式的这一缺点,我们引入一个分支粒子系统来优化粒子在时间分割点处的权重。对固定的δ0,∈=n-2α,0α1,初始存在,u个粒子,每个粒子的初始位置为Xin,δ,ε(0),i=1,2,……,n,其是Rd上独立同分布的随机变量,粒子初始的权重为1.假定时间区间为[0,T]且N*=[T/ε]是不大于Tε的最大整数。定文ε(t)=jε对j∈≤t(j+1)∈.在时间区间[j∈,(j+1)∈),j≤N*内,有mnj个粒子存活且它们的位置和权重如下决定:对i=1,2,……:mjn,其中初始值定义为:Xin,δ,ε(0)=x,Ain,δ,ε(0,0)=1,m0n=n.我们定义非正规化逼近滤波如下:我们得到定理4.5. 对任意t∈[0,T],δ0,ε=n-2α和0α1/2,存在常数Kδ使得Eρ12(Vn,δ,ε(t),Vδ(t))≤KTn-(1-2α)+Kδ,Tn-2α.我们定义即Vn,δ,ε(t)的光滑密度,作为u(t,x)的数值逼近,定义vn,δ,ε(t,x)=vn,δ,ε(T-t,x)作为u(t,x)的数值逼近。然后,我们有下列推论:推论4.1.对任意存在常数Kδ,使得我们应用Euler格式来逼近FBSDE(4.1.1)中的X(t).定义数值解Xn,δ,ε(t)满足:定理4.6.Xn,δ,ε(t)到X(t)的收敛被Kδ,T,(n-(1-2α)V n-2α)+KTδ界住。根据四步法的结果,我们定义Yn,δ,ε(t)=vnδ,ε(t,Xtn,δ,ε)作为FBSDE(4.1.1)中Y(t)的数值解。我们有下列定理:定理4.7.Yn,δ,ε(t)到Y(t)的收敛被界住。4.完全信息和部分信息下正倒向随机系统的最优保费策略4.1.完全信息下最优保费问题考虑一个保险公司,其现金余额过程Xtu满足其决策人的控制策略u在下述意义下是容许的。定义5.1.一个R值保费策略v={vt}0≤t≤T被称为容许的,如果对每个0≤t≤T,ut是FtW-适应的且E∫0Tut4dt+∞.给状态过程Xtv添加一个终端约束满足EXTv=w0. (5.1.2)考虑递归效用或风险度量Ytv满足:假设代价泛函的形式为其中β是贴现因子,Ut是动态预设目标,R是递归效用的预设目标,Lt,Nt:M和Q是权重因子。完全信息下最优保费问题(简称OPFI)|冻述如下:问题(OPFI).找到u∈uF使得J[v]=infv∈vF J[v]满足(5.1.1),(5.1.2)及(5.1.3).该问题的主要结果是如下定理:定理5.1.假设(H5.1)成立。若vt=-Nt-1eβt(pt-Btqt)是问题(OPFI)的最优保费策略,则其可以表示为其中(X,Y Z,p,q,k),λt1,λt1,ψt,αt1,αt2和αt3分别是(5.1.10);(511.15),(5.1.16),(5.1.17),(5.1.21),(5.1.22)和(5.1.23)的解。定理5.2.假设(H5.1)成立。则问题(OPFI)的最优保费策略为其中Xt满足(5.1.24),λt1,λt2,ψt,αt1,αt2和αt3分别是(5.1.15),(5.1.16),(5.1.17),(5,1.21),(5.1.22)和(5.1.23)的解。此外,在假设(H5.2)下,最优价泛函表示为(5.1.35).4.2.部分信息下最优保费问题我们假设决策者只能从股票上获得信息,考虑系统和其中现金余额过程Xtu是潜在因子,其能够通过即时波动率为ht的信号(观测)Stv被部分观测到。给出一个容许控制的定义。令是R值gt-适应的过程使得:定义5.2.控制u被称为容许的,如果u∈uad0是gt-适应的。容许控制集记为玩uad.部分信息下最优保费问题(简称OPPI)陈述如下:问题(IPPI).寻找u∈uad使得J[v]=infv∈vad J[v]满足(5.2.41),(5.2.42)和(5.1.2).该问题的主要结果是如下定理:定理5.3.假设(H5.1)成立。假定u是问题(OPPI)的最优保费策略而(X,YZ)是相应的最优状态。则FBSDE存在唯一解(p:q,k)∈LFW2(0,T;R)使得其中gt(?)σ{Ss:0≤s≤t}.定理5.4.假设(H5.1)成立。令u∈uad满足其中(X,Y,Z,p,q,k)是(5.2.48)的解。则u是问题(OPPI)的最优保费策略。定理5.5.假设(H5.1)成立。若vt=eβtNt-1(Btqt-pt)是问题(OPPI)的最优控制,则其可表示为其中(X,Y,Z),(p,q,k),αt1,αt1,αt3,λt1,λt2和中ψt分别是(5.2.56)当u=u,(5.2.61),(5.1.15),(5.1.16),(5.1,17),(5.1.21),(5,1.22)和(5.1.23)的解。定理5.6.假设(H5.1)和(H5.3)成立。则问题(OPPI)的最优保费策略为其中又:满足(5.2.56),λt1,λt2,ψt,αt1,αt2,和αt3分烈是(5.1.15)1(5.1.16),(5.1.1,7),(5.1.21),(5.1.22)和(5.23)的解。此外,在假设(H5.2)下,最优代价泛函由(5.2.66)给出。
【学位单位】:山东大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:O211.63;F830
【部分图文】:
始的最优保费策略为逡逑叫)全邋u(0)二在(0)邋=邋—1.203正0邋+邋0.化8w0邋+邋0.日88.逡逑图5.7描述了初始最优保费策略UO与初始准备金rco及现金余额终端约束W0邋H者逡逑之间的关系。逡逑当;r0固定,u0与w0呈正线性相关,w0越大,M0越大;当w0固定,ti0与;r0呈负逡逑线性相关,:C0越大,M0越小。逡逑若我们取正0邋=撕.5亿,w0邋=邋¥1.5亿,则U0邋=邋¥0.973亿。这意味着如果保险公司.逡逑有初始现金余额¥0.5化且要求终端现金余额的期望达到¥1.5亿,它需要收取初始保费逡逑¥0.973邋化。逡逑当0r0,w0)取值位于图日.7中所示黄色H角区域,则初始最优保费W0邋<邋0.这可W理逡逑解为当初始准备金X0较多而现金余额终端约束W日较小时,保险公司不收取初始保费逡逑反而向投保人分红W吸引客户群体。逡逑89逡逑
本文编号:2819398
【学位单位】:山东大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:O211.63;F830
【部分图文】:
始的最优保费策略为逡逑叫)全邋u(0)二在(0)邋=邋—1.203正0邋+邋0.化8w0邋+邋0.日88.逡逑图5.7描述了初始最优保费策略UO与初始准备金rco及现金余额终端约束W0邋H者逡逑之间的关系。逡逑当;r0固定,u0与w0呈正线性相关,w0越大,M0越大;当w0固定,ti0与;r0呈负逡逑线性相关,:C0越大,M0越小。逡逑若我们取正0邋=撕.5亿,w0邋=邋¥1.5亿,则U0邋=邋¥0.973亿。这意味着如果保险公司.逡逑有初始现金余额¥0.5化且要求终端现金余额的期望达到¥1.5亿,它需要收取初始保费逡逑¥0.973邋化。逡逑当0r0,w0)取值位于图日.7中所示黄色H角区域,则初始最优保费W0邋<邋0.这可W理逡逑解为当初始准备金X0较多而现金余额终端约束W日较小时,保险公司不收取初始保费逡逑反而向投保人分红W吸引客户群体。逡逑89逡逑
【参考文献】
相关期刊论文 前3条
1 LIU HuiLi;XIONG Jie;;A branching particle system approximation for nonlinear stochastic filtering[J];Science China(Mathematics);2013年08期
2 ;MAXIMUM PRINCIPLE FOR OPTIMAL CONTROLPROBLEM OF FULLY COUPLEDFORWARD-BACKWARD STOCHASTIC SYSTEMS[J];Systems Science and Mathematical Sciences;1998年03期
3 吴臻,于志勇;LINEAR QUADRATIC NONZERO-SUM DIFFERENTIAL GAMES WITH RANDOM JUMPS[J];Applied Mathematics and Mechanics(English Edition);2005年08期
本文编号:2819398
本文链接:https://www.wllwen.com/jingjilunwen/guojijinrong/2819398.html