基于部分可观测马尔科夫决策过程的干扰决策研究
【学位单位】:西安电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TN974;O225
【部分图文】:
图 2.24 迭代—Brown 算法求解结果图 2.25 线性规划算法求解结果由仿真结果可得根据迭代—Brown 算法可得干扰方的混合策略解为J 0.4581,0.2087,0.3332 (2-42)
图 2.24 迭代—Brown 算法求解结果图 2.25 线性规划算法求解结果由仿真结果可得根据迭代—Brown 算法可得干扰方的混合策略解为J 0.4581,0.2087,0.3332 (2-42)
【相似文献】
相关期刊论文 前10条
1 侯文超;经营策略的选择——马尔科夫决策在经营管理中的应用[J];北京商学院学报;1989年04期
2 雷霆;朱承;张维明;;基于马尔科夫决策的目标选择策略[J];国防科技大学学报;2014年02期
3 王珊;陆志强;;基于马尔科夫决策过程的慢性非传染性疾病体检策略的优化[J];工业工程与管理;2015年01期
4 苏春;周小荃;;基于半马尔科夫决策过程的风力机状态维修优化[J];机械工程学报;2012年02期
5 于波;于东;孙建伟;;马尔科夫决策过程在多路径冗余传输调度算法中的应用[J];小型微型计算机系统;2012年04期
6 柯文德;陈珂;余凤燕;;分层强化学习原理研究[J];广东石油化工学院学报;2013年04期
7 顾巧论;季建华;高铁杠;;马尔科夫决策过程在R/M系统库存控制中的应用[J];数学的实践与认识;2008年15期
8 秦强;胡昌振;;基于马尔科夫决策过程的软件测试仿真与计算[J];数值计算与计算机应用;2014年02期
9 尤树华;周谊成;王辉;;基于神经网络的强化学习研究概述[J];电脑知识与技术;2012年28期
10 王炜;刘茂;王丽;;基于马尔科夫决策过程的应急资源调度方案的动态优化[J];南开大学学报(自然科学版);2010年03期
相关博士学位论文 前6条
1 肖华;无线通信中的马尔科夫决策过程研究[D];电子科技大学;2013年
2 刘峰;基于部分可观察马尔科夫决策过程的序列规划问题的研究[D];南京大学;2015年
3 周志恒;无线网络中基于网络编码的数据恢复与重传机制及其算法[D];电子科技大学;2014年
4 柏爱俊;基于马尔科夫理论的不确定性规划和感知问题研究[D];中国科学技术大学;2014年
5 张田;无线通信中高谱效与高能效的功率管理研究[D];山东大学;2014年
6 陈丽娜;关系型不确定环境中一阶决策理论规划方法研究[D];国防科学技术大学;2012年
相关硕士学位论文 前10条
1 张思齐;基于部分可观测马尔科夫决策过程的干扰决策研究[D];西安电子科技大学;2019年
2 董昊;基于半马尔科夫决策过程的变压器状态优化维修策略的研究[D];华北电力大学;2016年
3 宋佳佳;部分观测马尔科夫决策过程中基于记忆的强化学习问题研究[D];天津工业大学;2017年
4 孟涵琳;无线网络通信计算资源联合优化研究[D];北京邮电大学;2016年
5 周浩浩;不确定环境下的序列决策问题研究[D];国防科学技术大学;2011年
6 韩冰;基于点的POMDP策略迭代算法设计与实现[D];南京大学;2014年
7 万小平;分布式任务自主分配和协同控制[D];陕西师范大学;2014年
8 张煜;基于POMDP网络认知的动态频谱接入算法与策略分析[D];南京邮电大学;2012年
9 王文浩;网络化制造环境下的库存管理方法研究[D];上海交通大学;2011年
10 崔晋培;MDP框架下无线多媒体业务传输的资源优化研究[D];西安电子科技大学;2017年
本文编号:2874538
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2874538.html