当前位置:主页 > 科技论文 > 信息工程论文 >

基于部分可观测马尔科夫决策过程的干扰决策研究

发布时间:2020-11-08 08:35
   随着雷达技术的不断发展,雷达在现代电子战争中发挥的作用越来越大,若想保证己方目标不被雷达探测到,就必须对敌方雷达实施干扰,降低雷达发现目标的概率。通常雷达方和干扰方之间是一个动态博弈的过程,在复杂的电磁环境下,雷达方与干扰方是非合作方,干扰方想要准确地获得雷达的策略是非常困难的,因此传统的干扰决策技术无法很好的对雷达实施干扰。本文提出了一种基于部分可观测马尔科夫决策过程(Partially Observable Markov Decision Processes,POMDP)的干扰决策技术,该方法可以保证在无法获得敌方雷达策略的前提下,干扰方依旧可以得到良好的决策结果。论文主要从以下几个方面对该方法进行了研究。本文首先对干扰决策技术进行了详细地分析,讨论了干扰决策技术的基本原理和工作特点,阐述了压制性干扰和欺骗性干扰的干扰原理,仿真分析了几种典型干扰方式的时频域特征。然后对智能干扰决策技术和基于博弈论的干扰决策技术进行了研究,并仿真分析了基于博弈论的干扰决策技术,给出了干扰决策结果,指出了现有干扰决策存在的问题。然后对POMDP进行了研究,POMDP是马尔科夫决策过程(Markov Decision Processes,MDP)的扩展。论文中先对MDP进行建模分析,然后根据POMDP的特点重新定义了决策过程的性能准则、决策策略以及信念状态,建立了POMDP的基本模型,并对POMDP的几种求解方法进行了研究。最后将POMDP应用于干扰决策技术当中,讨论POMDP中的状态空间、行动空间、转移概率函数、观测空间、观测概率函数以及即时收益模块在干扰决策技术中的含义,建立了基于POMDP的干扰决策模型,并对该模型进行求解,分析基于POMDP的干扰决策结果,并将仿真结果分别和直接基于观测值的干扰决策技术以及基于博弈论的干扰决策技术进行比较。仿真结果显示,基于POMDP的干扰决策技术结果优于其他两种干扰决策技术的结果,并且该方法在只能获得部分雷达观测参数的情况下,仍能得到良好的干扰决策结果,有效地解决了干扰方和雷达方为非合作关系时干扰方无法对雷达进行有效干扰的问题。
【学位单位】:西安电子科技大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TN974;O225
【部分图文】:

迭代,算法,线性规划算法,混合策略


图 2.24 迭代—Brown 算法求解结果图 2.25 线性规划算法求解结果由仿真结果可得根据迭代—Brown 算法可得干扰方的混合策略解为J 0.4581,0.2087,0.3332 (2-42)

线性规划算法,迭代


图 2.24 迭代—Brown 算法求解结果图 2.25 线性规划算法求解结果由仿真结果可得根据迭代—Brown 算法可得干扰方的混合策略解为J 0.4581,0.2087,0.3332 (2-42)
【相似文献】

相关期刊论文 前10条

1 侯文超;经营策略的选择——马尔科夫决策在经营管理中的应用[J];北京商学院学报;1989年04期

2 雷霆;朱承;张维明;;基于马尔科夫决策的目标选择策略[J];国防科技大学学报;2014年02期

3 王珊;陆志强;;基于马尔科夫决策过程的慢性非传染性疾病体检策略的优化[J];工业工程与管理;2015年01期

4 苏春;周小荃;;基于半马尔科夫决策过程的风力机状态维修优化[J];机械工程学报;2012年02期

5 于波;于东;孙建伟;;马尔科夫决策过程在多路径冗余传输调度算法中的应用[J];小型微型计算机系统;2012年04期

6 柯文德;陈珂;余凤燕;;分层强化学习原理研究[J];广东石油化工学院学报;2013年04期

7 顾巧论;季建华;高铁杠;;马尔科夫决策过程在R/M系统库存控制中的应用[J];数学的实践与认识;2008年15期

8 秦强;胡昌振;;基于马尔科夫决策过程的软件测试仿真与计算[J];数值计算与计算机应用;2014年02期

9 尤树华;周谊成;王辉;;基于神经网络的强化学习研究概述[J];电脑知识与技术;2012年28期

10 王炜;刘茂;王丽;;基于马尔科夫决策过程的应急资源调度方案的动态优化[J];南开大学学报(自然科学版);2010年03期


相关博士学位论文 前6条

1 肖华;无线通信中的马尔科夫决策过程研究[D];电子科技大学;2013年

2 刘峰;基于部分可观察马尔科夫决策过程的序列规划问题的研究[D];南京大学;2015年

3 周志恒;无线网络中基于网络编码的数据恢复与重传机制及其算法[D];电子科技大学;2014年

4 柏爱俊;基于马尔科夫理论的不确定性规划和感知问题研究[D];中国科学技术大学;2014年

5 张田;无线通信中高谱效与高能效的功率管理研究[D];山东大学;2014年

6 陈丽娜;关系型不确定环境中一阶决策理论规划方法研究[D];国防科学技术大学;2012年


相关硕士学位论文 前10条

1 张思齐;基于部分可观测马尔科夫决策过程的干扰决策研究[D];西安电子科技大学;2019年

2 董昊;基于半马尔科夫决策过程的变压器状态优化维修策略的研究[D];华北电力大学;2016年

3 宋佳佳;部分观测马尔科夫决策过程中基于记忆的强化学习问题研究[D];天津工业大学;2017年

4 孟涵琳;无线网络通信计算资源联合优化研究[D];北京邮电大学;2016年

5 周浩浩;不确定环境下的序列决策问题研究[D];国防科学技术大学;2011年

6 韩冰;基于点的POMDP策略迭代算法设计与实现[D];南京大学;2014年

7 万小平;分布式任务自主分配和协同控制[D];陕西师范大学;2014年

8 张煜;基于POMDP网络认知的动态频谱接入算法与策略分析[D];南京邮电大学;2012年

9 王文浩;网络化制造环境下的库存管理方法研究[D];上海交通大学;2011年

10 崔晋培;MDP框架下无线多媒体业务传输的资源优化研究[D];西安电子科技大学;2017年



本文编号:2874538

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2874538.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户030af***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com