半Markov决策过程折扣模型与平均模型之间的关系
[Abstract]:Firstly, a class of semi-M arkov decision problems is discussed under the discounted cost and average cost performance criteria, respectively. Based on the performance potential method, the optimality equation satisfied by the optimal stationary strategy is derived. Then the relationship between the two models is discussed and the results of the average model can be obtained by taking the discount factor to the limit of 00:00 for the corresponding conclusions of the discount model.
【作者单位】: 中国科学技术大学自动化系 中国科学技术大学自动化系 合肥工业大学计算机系 中国科学技术大学自动化系 中国科学技术大学自动化系
【基金】:国家自然科学基金资助项目(60274012,60574065) 安徽省自然科学基金资助项目(050420301)
【分类号】:C934
【参考文献】
相关期刊论文 前1条
1 宋京生;转移速率族非一致有界的连续时间马氏决策规划[J];中国科学(A辑 数学 物理学 天文学 技术科学);1987年12期
【共引文献】
相关期刊论文 前10条
1 朱承军;周建中;;电力市场中梯级水电站组合交易策略研究[J];华东电力;2006年07期
2 段楠楠;;电子商务企业客户关系的预测与动态管理[J];华东交通大学学报;2010年01期
3 黄力平;Q过程的马氏控制及其最优控制[J];湖北大学学报(自然科学版);1991年03期
4 滕海文;霍达;李悦;;设计基准期内抗震结构维修策略优化[J];哈尔滨工业大学学报;2006年02期
5 柴雪霞;马学森;周雷;唐昊;;基于SMDP模型的Web服务组合优化方法[J];合肥工业大学学报(自然科学版);2011年10期
6 刘虹;;基于MDP自适应决策的库存控制[J];河北建筑科技学院学报;2006年03期
7 李薇;林干;;多任务条件下地空导弹武器装备视情维修策略[J];火力与指挥控制;2011年04期
8 刘发贵;麦伟鹏;黄凯耀;;动态电源管理随机模型算法的设计与实现[J];华南理工大学学报(自然科学版);2007年09期
9 郭先平;Q(f)-过程非唯一时连续时间折扣目标MDP[J];湖南师范大学自然科学学报;1996年03期
10 刘仲英,吴冰,张新武;企业知识管理战略变化的分析模型[J];管理科学;2004年04期
相关会议论文 前2条
1 刘翱;刘克;刘广;崔珊珊;;基于马尔可夫决策过程的调度问题建模[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
2 李金林;徐丽萍;;超订下舱位控制的R-MDP模型与稳健策略[A];第三届(2008)中国管理学年会论文集[C];2008年
相关博士学位论文 前10条
1 曹晓刚;原材料价格波动下的生产—库存管理研究[D];武汉大学;2009年
2 冯奇;POMDP近似解法研究及在中医诊疗方案优化中的应用[D];北京交通大学;2011年
3 杨洁;开放量子系统的建模及其控制[D];中国科学技术大学;2011年
4 赵浩;感知无线电系统中机会频谱接入技术的研究[D];北京邮电大学;2010年
5 牛建军;无线传感器网络分布式调度方法研究[D];清华大学;2010年
6 毛李帆;电网规划中长期负荷预测技术的研究[D];湖南大学;2011年
7 张秀斌;视情维修决策模型及应用研究[D];中国人民解放军国防科学技术大学;2003年
8 范领进;知识价值理论研究[D];吉林大学;2004年
9 魏轶华;随机环境下的若干定价问题研究[D];西安电子科技大学;2004年
10 杜黎;网上拍卖与无形资产定价研究[D];西安电子科技大学;2004年
相关硕士学位论文 前10条
1 夏青青;道路交通安全事故成因及预测模型研究[D];长沙理工大学;2010年
2 李波;中医临床数据挖掘系统的研究与实现[D];北京交通大学;2011年
3 柴雪霞;基于强化学习的Web服务组合优化研究[D];合肥工业大学;2011年
4 任玲;无线传感器网络能量高效的传输策略研究[D];合肥工业大学;2011年
5 毛沙;无线传感器网络节能优化策略研究[D];合肥工业大学;2011年
6 袁野;基于强化学习算法的互联电网AGC随机最优控制[D];华南理工大学;2011年
7 胡细兵;基于强化学习算法的最优潮流研究[D];华南理工大学;2011年
8 吴燕如;基于马尔科夫模型的风电机组优化检修[D];华北电力大学;2011年
9 吕志科;基于随机供应的联合定价与库存控制研究[D];湘潭大学;2011年
10 梅牡丹;基于灰色理论的建筑施工事故的预测研究[D];安徽理工大学;2011年
【相似文献】
相关期刊论文 前10条
1 董泽清;;马尔可夫决策规划综述[J];经济数学;1984年00期
2 蒋翔;张丽君;龙伟忠;;企业存贮优化的经济订货批量折扣模型研究[J];商场现代化;2007年26期
3 周永务;;随机需求下两层供应链协调的一个批量折扣模型[J];系统工程理论与实践;2006年07期
4 王勇,唐浩阳,秦鹏;一维运输折扣模型及算法[J];重庆大学学报(自然科学版);2003年10期
5 牛志勇;黄沛;高维和;;基于最优反应均衡的渠道数量折扣模型及实验分析[J];管理科学;2010年02期
6 鲍忠奎;;基于销售商费用信息不对称下供应链协调的量折扣模型[J];南开大学学报(自然科学版);2010年02期
7 张文明;徐寅峰;苏兵;;顾客需求量不确定时生产商的在线数量折扣策略[J];运筹与管理;2011年02期
8 岳万勇;赵正佳;荆鹿;;跨国供应链数量折扣模型[J];华东经济管理;2011年09期
9 蒋金凤;不等间隔的一阶多项式模型及贝叶斯预测[J];统计与决策;2004年03期
10 王殿奎;朱翼隽;刘栋;;精益生产环境下生产线排队模型的性能优化分析[J];统计与决策;2006年23期
相关会议论文 前10条
1 沈淼森;康婉莹;钱照明;;新型正激单级功率因数校正电路的仿真平均模型[A];2001系统仿真技术及其应用学术会议论文集[C];2001年
2 李衍杰;殷保群;奚宏生;周亚平;;一类半Markov过程的灵敏度分析和性能优化[A];第二十二届中国控制会议论文集(下)[C];2003年
3 郑勇;谢祖军;汪荣江;倪四道;熊熊;葛粲;;地壳结构对汶川余震定位及震源机制反演的影响[A];中国地球物理·2009[C];2009年
4 王莹;盛四清;;基于自回归动平均模型和神经网络算法的加权组合的电力系统的负荷预测[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(上册)[C];2008年
5 徐华中;王江;王先来;;AC-DC变换器自适应控制器设计[A];1999中国控制与决策学术年会论文集[C];1999年
6 陈虬;雷震宇;;板壳结构的随机有限元分析[A];第七届全国结构工程学术会议论文集(第Ⅰ卷)[C];1998年
7 雷震宇;陈虬;;板壳结构动力响应的随机有限元分析[A];第八届全国结构工程学术会议论文集(第Ⅲ卷)[C];1999年
8 曹靖;李红涛;京华;徐继宁;;一种基于功率补偿器的多电平逆变器直流电压平衡的控制方法[A];2008中国电工技术学会电力电子学会第十一届学术年会论文摘要集[C];2008年
9 王建华;张方华;龚春英;杨宁;;开关变换器两端口网络建模、分析及设计[A];2009安捷伦科技节论文集[C];2009年
10 曹裕;陈晓红;李喜华;;基于企业生命周期的智力资本与企业绩效关系研究[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
相关重要报纸文章 前1条
1 孙彦 中国科学院心理研究所;风险让人们更加“只顾眼前”[N];中国社会科学报;2010年
相关博士学位论文 前8条
1 Khalil Ibrahem Othman;冲积河流水力及河床形态的数值模拟究[D];河海大学;2004年
2 李衍杰;扩展Markov决策过程的性能灵敏度分析与优化[D];中国科学技术大学;2006年
3 孔梅梅;人眼光学数字化模型及其光学参数干涉测试方法的研究[D];南京理工大学;2009年
4 尹晶;海岸沙坝运动的实验与数值模拟研究[D];大连理工大学;2012年
5 欧阳长莲;DC-DC开关变换器的建模分析与研究[D];南京航空航天大学;2005年
6 牛全民;基于PSM模式的DC-DC功率变换器非线性建模及集成化设计[D];电子科技大学;2009年
7 葛焰明;考虑转移因素的航空收益管理[D];复旦大学;2011年
8 杜彦良;河流中污染物垂向紊动混合规律及其应用研究[D];河海大学;2001年
相关硕士学位论文 前10条
1 唐浩阳;物流网络中的运输分派模型及其算法研究[D];重庆大学;2002年
2 吴玉华;SMDP基于性能势的异步优化算法[D];合肥工业大学;2006年
3 陈栋;SMDP基于性能势的NDP优化方法及应用研究[D];合肥工业大学;2006年
4 周雷;折扣和平均准则下SMDP基于性能势的统一强化学习算法[D];合肥工业大学;2006年
5 岳万勇;跨国供应链数量折扣模型的研究[D];西南交通大学;2011年
6 程燕;不确定SMDP基于性能势的鲁棒控制研究[D];合肥工业大学;2007年
7 王蓓蓓;多维模糊最优控制及其在最优停时中的应用[D];南京理工大学;2009年
8 吴慧;CSPS模型基于学习的Look-ahead控制研究[D];合肥工业大学;2007年
9 朱军卫;级联型相移载波SPWM逆变器的研究[D];南京航空航天大学;2004年
10 周卫东;中国荷斯坦奶牛泌乳曲线的数学模型及其遗传特性研究[D];浙江大学;2001年
,本文编号:2299502
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2299502.html