当前位置:主页 > 经济论文 > 经济管理论文 >

风险敏感性马尔科夫控制过程的最优解

发布时间:2020-03-18 16:18
【摘要】:最优控制问题指在一个动态系统中通过确定一个控制策略使性能标准达到最优(最大或最小).马尔科夫控制过程是随机动态系统中的一类.在最近五十年对随机动态最优控制问题的大量研究中,风险敏感性平均准则尤为受到关注.传统的马尔科夫控制过程研究方法有两种:(1)收缩映射法;(2)消失折现法.Cavazos-Cadena(2009)提出了另外一种分析证明方法,其主要结果利用基本的概率与分析准则通过相对独立的参数获得.通过引入相对值函数和分析被赋予风险敏感性总费用准则的停时问题验证了最优方程有界解的存在性和唯一性.本文在概述了马尔科夫控制过程的研究历史后,详细重点介绍了 Cavazos-Cadena的方法并运用此方法对最大化平均收益准则下最优方程的解进行了探索性研究.针对可数状态空间和紧致行动集合上的马尔科夫控制过程的最优解问题,本文控制策略的表现优劣由风险敏感性平均费用准则度量.为保证风险敏感性马尔科夫控制过程的最优方程的解存在,两条基本假设条件的成立是必要的:(ⅰ)同步Doeblin条件(SDC)成立;(ⅱ)马尔科夫控制过程{Xt}是平稳确定性策略下的马尔科夫链.在此框架下对于具有紧支撑的非负费用函数,最优平均费用函数是一常数.最优方程与最优平均费用函数的联系为:最优方程的解即是平均费用函数的最小值,且使最优方程成立的策略是最优平稳确定性策略.从而寻求最小平均费用的问题转变成求解最优方程.
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F224

【相似文献】

相关期刊论文 前10条

1 Shan-shan PAN;Wei-qiu ZHU;Rong-chun HU;Rong-hua HUAN;;随机激励下连续时间马尔科夫跳变非线性系统的平稳响应研究(英文)[J];Journal of Zhejiang University-Science A(Applied Physics & Engineering);2017年02期

2 黄麒元;王致杰;王东伟;杜彬;;马尔科夫理论及其在预测中的应用综述[J];技术与市场;2015年09期

3 翟波;;基于灰色-马尔科夫理论的煤矿瓦斯浓度预测[J];城市地理;2017年10期

4 王双成;刘喜华;唐海燕;;基于依赖分析的马尔科夫网络分类器学习与优化[J];模式识别与人工智能;2006年04期

5 高山珍,王永亮;7维广义马尔科夫方程的几个性质[J];石家庄铁道学院学报;2003年02期

6 高山珍,高静伟;广义马尔科夫方程解的存在性[J];河北职业技术师范学院学报;2003年03期

7 曹昌祺;原子自发辐射的非马尔科夫理论[J];量子光学学报;2002年S1期

8 吴卢荣,林运国;学生成绩预测的时齐马尔科夫法[J];聊城师院学报(自然科学版);2002年02期

9 李锦江,万新敏,刘德权;线性模型的最小二乘估计与马尔科夫估计[J];空军雷达学院学报;2000年04期

10 高山珍,李俊红,解建军;7维广义马尔科夫方程的解[J];贵州教育学院学报(自然科学);2000年02期

相关会议论文 前10条

1 周玲;张闻钊;李逊;;非马尔科夫环境下光力系统的纠缠与制冷[A];第十七届全国量子光学学术会议报告摘要集[C];2016年

2 倪中新;邱华;;基于马尔科夫机制转换模型的期现对冲研究[A];第十届(2015)中国管理学年会论文集[C];2015年

3 曹昌祺;;原子自发辐射的非马尔科夫理论[A];第十届全国量子光学学术报告会论文论文集[C];2002年

4 雷延军;李向阳;;基于两级双渠道供应链的马尔科夫库存优化模型研究[A];第九届中国管理科学学术年会论文集[C];2007年

5 田德源;陆治钊;;新马尔科夫法[A];第8届全国核电子学与核探测技术学术年会论文集(二)[C];1996年

6 李立阳;刘海天;付建苏;王会龙;张民强;;基于马尔科夫随机场的图像去噪[A];第六届中国指挥控制大会论文集(上册)[C];2018年

7 吕骥;曲泽星;高加力;;利用分子动力学和马尔科夫态模型研究真菌光感受器vivid的光致二聚化过程[A];中国化学会第30届学术年会摘要集-第十九分会:化学中的量子与经典动力学[C];2016年

8 陈其安;廖小红;王丹;陈抒妤;;中国大陆货币政策对香港股票市场的溢出效应:基于马尔科夫转换模型的实证研究[A];第十九届中国管理科学学术年会论文集[C];2017年

9 王纺翔;陈巍;李亚平;何德勇;王超;韩云光;王双;银振强;韩正甫;;单光子探测器后脉冲效应的费马尔科夫性质(英文)[A];第十七届全国量子光学学术会议报告摘要集[C];2016年

10 梁加驰;沈竞;;基于R语言的MCMC方法研究[A];第十届中国不确定系统年会、第十四届中国青年信息与管理学者大会论文集[C];2012年

相关重要报纸文章 前10条

1 记者 吴长锋;时而马尔科夫 时而非马尔科夫[N];科技日报;2011年

2 记者 张力;张德江会见俄罗斯联邦总统助理马尔科夫[N];中国人事报;2009年

3 记者 吕华;董军会见俄罗斯圣彼得堡市副市长马尔科夫[N];西安日报;2015年

4 谢思佳 符信;探讨深化合作模式[N];广州日报;2012年

5 本报记者 范昕;机器人无法胜任创造性工作[N];文汇报;2016年

6 记者 吴温;第四届中国(石家庄)皮博会开幕[N];石家庄日报;2012年

7 本报驻俄罗斯记者  马剑;“漂在石油上”的城市[N];人民日报;2006年

8 王蔚 肖丹 陶健;“中俄旅游年”上海全力开拓沪俄旅游市场[N];中国旅游报;2012年

9 蒋涌;文化的半径有多大?[N];自贡日报;2012年

10 王旭;泰和尼科:将在中国市场推进系统应用[N];中国建材报;2013年

相关博士学位论文 前10条

1 王军义;具有时变时滞的马尔科夫复杂神经网络的同步问题研究[D];东北大学;2016年

2 王继民;非线性广义半马尔科夫跳变系统的分析与综合[D];山东大学;2018年

3 李繁飙;半马尔科夫跳变系统的分析和综合[D];哈尔滨工业大学;2015年

4 龙少华;奇异时滞马尔科夫系统的容许性问题研究[D];电子科技大学;2013年

5 陶杰;马尔科夫跳变系统的耗散性分析与综合[D];浙江大学;2018年

6 张兴远;非马尔科夫演化及对量子热机性能的影响[D];大连理工大学;2016年

7 肖兴;开放量子系统的非马尔科夫动力学和弱测量反馈控制[D];湖南师范大学;2012年

8 杜元花;几类随机微分方程的稳定性分析[D];电子科技大学;2016年

9 范子龙;高维开放量子系统的非马尔科夫动力学研究[D];湖南师范大学;2016年

10 邹红梅;非马尔科夫环境下量子系统的非经典效应[D];湖南师范大学;2014年

相关硕士学位论文 前10条

1 于娜;风险敏感性马尔科夫控制过程的最优解[D];武汉大学;2018年

2 孙锡林;基于马尔科夫逻辑网的公安盗窃犯罪案件推理研究[D];华中科技大学;2018年

3 付晓阅;广义马尔科夫跳变系统的正解及稳定性研究[D];东北大学;2015年

4 王明晗;马尔科夫体制转换模型下达到遗赠目标的最优投资与再保险[D];安徽师范大学;2018年

5 胡程科;马尔科夫岩性预测及基于信息熵的观测点位置和数量优化[D];清华大学;2017年

6 吴佩;基于混合马尔科夫树模型的ICS异常检测方法研究[D];合肥工业大学;2018年

7 蔡蕊;一类带马尔科夫切换的非线性时滞利率模型及其数值方法的收敛性[D];东华大学;2012年

8 郭一木;基于张量链的并行和增量系统实现与应用[D];华中科技大学;2017年

9 陈微;马尔科夫跳跃线性系统模态反馈控制问题研究[D];中国科学技术大学;2018年

10 丁琴;具有可控MTPM的离散马尔科夫跳跃系统控制问题研究[D];中国科学技术大学;2017年



本文编号:2588919

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/2588919.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户99d18***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com