基于强化学习理论的通信干扰策略学习方法研究

发布时间:2021-07-22 15:13
  随着电子战在现代战争中的地位愈加凸显,夺取电磁频谱的控制权已成为战场制胜的关键手段。由于干扰环境的复杂性以及敌方在通信过程中采用多种抗干扰技术、人工智能技术,极大地增加了成功干扰的难度。值得庆幸的是,认知干扰概念的提出,拉近了对抗双方在博弈能力上的差距。特别是将强化学习理论用于通信干扰策略学习,使得干扰设备在与环境的交互过程中不断调整干扰策略,克服了未知因素对学习的影响,并最终实现最优干扰策略的学习。当前对干扰策略的研究仍存在一定的问题,突出体现在耗费过多交互次数以及应用场景局限性。本文针对不同场景下干扰策略的学习方法展开研究,主要研究内容如下:(1)复杂未知的电磁环境致使目标信号的星座图发生不同程度的畸变,经典的最佳干扰策略往往并非最佳。为了学习到受畸变信号的最佳干扰样式,提出了一种针对高阶调制信号的通用干扰样式构造方法,通过正交分解的方式构造不同种类的干扰样式。现有强化学习算法用于最优干扰策略学习,试错次数多,收敛速度慢,论文分别从搜索和预测两个角度提高最优干扰策略学习的时效性。在搜索策略研究方面:(1)利用离散划分后干扰动作之间的相关特性,提出了一种基于正强化学习的干扰策略学习算... 

【文章来源】:国防科技大学湖南省 211工程院校 985工程院校

【文章页数】:194 页

【学位级别】:博士

【部分图文】:

基于强化学习理论的通信干扰策略学习方法研究


马尔科

基于强化学习理论的通信干扰策略学习方法研究


赌场里的老虎机不管是从多台单臂老虎机中挑选老虎机,还是从一台多臂老虎机上选择摇杆,

【参考文献】:
期刊论文
[1]认知电子战体系结构与技术[J]. 王沙飞,鲍雁飞,李岩.  中国科学:信息科学. 2018(12)
[2]16-QAM信号的最佳干扰分析[J]. 孙志国,徐天宇,邓昌青,宁晓燕,郭黎利.  哈尔滨工程大学学报. 2018(07)
[3]未知拓扑无线自组网络多节点干扰决策算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举.  西安交通大学学报. 2018(06)
[4]采用双层强化学习的干扰决策算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举.  西安交通大学学报. 2018(02)
[5]基于正强化学习和正交分解的干扰策略选择算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举.  系统工程与电子技术. 2018(03)
[6]一种基于离散插值的多项式曲线逼近有理曲线的方法[J]. 李光耀,杨连喜,徐晨东.  浙江大学学报(理学版). 2017(06)
[7]基于强化学习的无线自组网络多节点干扰策略[J]. 颛孙少帅,杨俊安,刘辉,黄科举.  控制与决策. 2018(07)
[8]样条插值法在轮对压装曲线处理中的应用[J]. 肖峻,杨铮,杜兆勇,黄海涛.  机床与液压. 2017(08)
[9]多干扰机反向交叉眼干扰分析[J]. 王彩云,何志勇,宫俊.  系统工程与电子技术. 2017(07)
[10]多机协同电子战规划压制干扰布阵研究[J]. 张欢,杨任农,吴军,李秋妮,傅修竹,孙长月.  系统工程与电子技术. 2017(03)

博士论文
[1]基于智能体的多机器人系统学习方法研究[D]. 刘强.哈尔滨工业大学 2016
[2]基于值函数估计的强化学习算法研究[D]. 陈兴国.南京大学 2013
[3]基于构造型前馈神经网络的函数逼近与应用[D]. 侯木舟.中南大学 2009

硕士论文
[1]基于强化学习的移动机器人自适应模型研究[D]. 岳文应.浙江理工大学 2018
[2]基于多智能体强化学习的足球机器人决策策略研究[D]. 丁明刚.合肥工业大学 2017



本文编号:3297386

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3297386.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c9d1b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com