我国商业医疗保险市场准入机制研究——基于动态博弈视角
李孟洁 西安财经学院
摘要:通过构建动态博弈模型来研究中国商业医疗保险市场初始设计的准入机制和制度铺垫是学术界面临的新课题。研究发现,在设计商业医疗保险市场时,政府和企业存在着动态博弈关系。其中二者实现多边惩罚策略条件下的子博弈精炼纳什均衡,需要每个政府搜寻到并吸纳一个商业保险市场待进入企业,同时多边惩罚策略能激励政府严格地偏好于吸纳一个诚实的待进入企业。因此,政府的惩罚策略的有效性和企业诚信度是确保商业医疗保险市场设计能否成功的关键。
关键词:商业医疗保险市场;多边惩罚策略;子博弈精炼纳什均衡
一、我国商业保险市场的现状与本文研究问题的提出
目前,我国商业医疗保险的现状是尚处于探索发展、亟需完善的阶段。制约我国商业医疗保险市场的根本问题,不仅是政府不合理的政策优惠,而是根本上的不合理甚至残缺的准入机制设计。这就要求政府首先应该立足于建设完整而合理的商业医疗保险市场准入机制和制度铺垫。假设政府和企业都是完全理性的,政府的理性选择是向准备进入商业医疗保险市场的企业让与更少的优惠,企业的理性选择是为了获得更多的优惠而决定保持诚实还是选择欺诈,如果准入机制设计不合理、制度铺垫不充分,一方面政府将向准备进入商业医疗保险市场的企业让与更多的优惠,另一方面政府不能保证吸纳到诚实的企业,最终的结果将由于过多的负外部性和企业的道德风险导致商业医疗保险市场秩序混乱,弱化商业医疗保险市场的稳定性和持久性。
由此可见,设计商业医疗保险市场的准入机制和制度铺垫需要集中解决的问题是政府怎样才能在向企业让与更少的优惠(比如税收方面)时,吸纳到诚实的企业并促使其保持诚实的连续性。
本文构建了一个多边惩罚策略条件下的完全信息动态博弈模型,证实了商业医疗保险市场准入机制设计阶段存在一个子博弈精炼纳什均衡,同时发现政府即便减少偿付给企业的“优惠”也能够吸纳到诚实的企业。
二、商业医疗保险动态博弈模型的架构
本模型考虑了一个有N个政府与A个准备进入商业医疗保险市场的企业(下文称待进入企业)的经济体,其中N<A,所有政府和待进入企业在商业医疗保险市场中是无限期存在的。模型赋予待进入企业一个时间贴现因子e,,且没被吸纳的待进入企业每一期得到的保留效用为j≥0。在任意一期,一个待进入企业只能与一个政府相匹配,而且每个政府也只能匹配一个待进入企业。两者之间的匹配(这种匹配可以看做是吸纳和被吸纳关系)是随机的,但是某个政府可以将这种匹配限定在一个未被吸纳的待进入企业子集中,本模型定义这一子集b=(b1,……,bi,……bi)。根据政府可获得的信息,这些待进入企业在先前已经采取一系列特定的行动。
如果政府不吸纳任何一个待进入企业,定义它获得的收益是m>0。如果政府选择合作,亦即吸纳企业,定义其在合作中得到的总收益为γ。政府的当期决策是向其吸纳的商业医疗保险企业让与多少优惠(W≥0)。受吸纳的商业医疗保险企业,在政府给定的优惠下,能够理性地决定自己的策略是保持诚实还是欺诈。如果商业医疗保险企业选择诚实策略,那么政府的收益为γ-W,商业医疗保险企业的获得政府让与的优惠W。如果商业医疗保险企业选择欺诈策略,它的收益就是q>0,政府的收益为γ-q。假设γ>m+j,合作就是有效率的;γ>q>j,欺诈会使政府蒙受损失,商业医疗保险企业愿意选择欺诈而非选择获得保留效用;m>γ-q,政府会选择不吸纳商业医疗保险企业并获得收益m,而不是选择被商业医疗保险企业蒙骗。给定这些收益,每个政府会决定是否终止同待进入企业的关系。然而,像强烈的政策性波动、大范围突发性自然灾害等外生因素会使政府不得不选择终止吸纳关系(有一个概率s)。
假定博弈过程是人所共知的常识,同时假定待进入企业“如果欺骗,就被抛弃;如果诚实,就会继续被吸纳”(除非吸纳关系被迫终止),此时,所有政府愿意让与给待进入企业的最低(对称性)优惠达到什么水平,才能使待进入企业选择诚实作为最优策略?确定这个优惠水平需要完全界定清楚政府的策略。为了在同一个框架下分析不同的策略影响,一开始就要集中分析概率,因为这些概率是策略本身的函数。
模型先定义一个未被吸纳的待进入企业,它在上一期表现诚实,从而作为一个诚实的待进入企业被政府吸纳,模型用hh表示它当期被吸纳的概率。接着,模型再定义一个未被吸纳的待进入企业,它曾在上一期因欺骗而被政府怀疑,它在当期被吸纳的概率为hc。命题给出了保证诚实行为的最低优惠。
假定e∈(0,1)且hc<1。最优优惠水平,即让与给待进入企业并能使其将诚实作为最优策略选择的最低优惠为W*=f(e,hh,hc,s,j,q)>j,f随着e和hh单调递减,随着hc,s,j和q单调递增。
对一个给定的hc和hh,为了说明诚实是待进入企业的最优策略,只要证明在优惠为W*的情况下,待进入企业在某一期中行骗得不到任何好处。相应地,用Yh表示待进入企业一旦被吸纳就保持诚实的终身期望效用的现值,Yuh表示一个未被吸纳的诚实待进入企业的终身期望效用,Yuc表示一个未被吸纳的行骗者的终身期望效用(如果被吸纳,他将在未来诚实)。这些终身期望效用是:
Yh= W*+e(1-s) Yh+sYuh,Yui=ehi Yh+e(1- hi)(1+eYui),i=h,c
行骗一次产生q+Yuc。如果Yuc≥q+Yuc,待进入企业就不会行骗。代入并整理这些条件,发现当且仅当W≥(T-eHh)﹛q/(1-eHC)+ej[Pc/(1-eHC)-sPh]﹜= W*,其中,T=1-e(1-s);Hi= hi/[1-e2(1-h2)],i=h,c;Pi=(1-hi)/[1-e2(1-hi)],i=h,c。由于事实上hc≤hh,函数f的相关单调性可以从这个表达式中得出。
在多边惩罚策略下,促使待进入企业诚实的激励在于,得到超过保留效用的政府优惠这一奖励性措施和解雇这一惩罚性措施。如果未被吸纳的行骗企业和被吸纳的待进入企业的终身期望效用之间的差别大于从一个时期的行骗中所获得的收益,那么待进入企业的最优反应就是保持诚实。以下几种情况可以降低最优优惠:诚实的待进入企业更有可能获得将来的政府优惠(较高的hh);待进入企业从行骗中得到的优惠减少(较低的q);诚实的待进入企业更有可能维持吸纳关系(较低的s);待进入企业没有其他更好的机会(较低的j),行骗的待进入企业受吸纳的机会更小(较低的hc)。另外,如果待进入企业更看重将来的收入(较高的e),因为诚实的回报和行骗的惩罚都发生在将来,则最优优惠水平也会下降。
多边惩罚策略要构成一个对称的子博弈精炼均衡,就要求每个政府都应该发现吸纳一个待进入企业是最优的。在均衡路径上,这个条件就意味着让与优惠设置的足够低,也就是W*= f(e,hh,hc,s,j,q)≤γ-m,且hh=sN/[A-(1-s)N]。假设该条件成立。一个政府能否发现惩罚一个没有欺骗它的待进入企业是最优的呢?当替换待进入企业不增加任何成本时(这里的假设),政府会惩罚行骗者;因此,这样的多边惩罚策略是一个子博弈精炼均衡。
三、结论
在政府设定的多边惩罚策略下,诚实的商业保险市场待进入企业可以预期在将来被吸纳,而曾经行骗的待进入企业则没有这个希望。因为最优“优惠”是将来被吸纳概率的递减函数,所以行骗者的最优“优惠”高于诚实待进入企业的最优“优惠”。因此政府严格倾向吸纳诚实的待进入企业。所有政府未经协调的行动,以及他们观察到的将来的预期行为与每个待进入企业最优“优惠”之间的关系,确保了该政府群体内激励的一致性。
代理关系中断的可能性关系到每个政府必须支付给待进入企业的最优“优惠”,以及待进入企业与其他政府预期的未来关系。这种关联使得行骗者的最优“优惠”高于诚实者的最有“优惠”,原因是惩罚与待进入企业过去的行为无关,而回报却不是这样。因此,尽管待进入企业的策略并不要求他去欺骗违反集体惩罚机制的政府,以及过去曾经有过欺骗行为的待进入企业并不能说明他就是个“次品”,所有的政府还是会对理性的企业遵守这种多边惩罚机制深信不疑。
参考文献
[1]西班牙,费尔南多•维加-雷东多.经济学与博弈理论[N].毛亮等译,上海:上海人民出版社,2006:115-118
[2]瑞典,乔根•W•威布尔.演化博弈论[N].王永钦译,上海:上海三联书店,上海人民出版社,2006:133-138
[3]美国,朱•弗登伯格,戴维•K•莱文.博弈学习理论[N].肖争艳等译,北京:中国人民大学出版社,2004:204-218
[4]张维迎.博弈论与信息经济学[N].上海:上海人民出版社,2002:135-178
[5]张海冰.国内外医疗保险运行模式比较研究[J].大连理工大学学报,2010,(3):84-86
[6] 郑苏晋.博弈论视角下我国商业医疗保险市场的信息不对称分析[J].中央财经大学学报,2010,(8):114-115
本文编号:18195
本文链接:https://www.wllwen.com/guanlilunwen/gonggongguanlilunwen/18195.html