基于强化学习理论的通信干扰策略学习方法研究
发布时间:2021-07-22 15:13
随着电子战在现代战争中的地位愈加凸显,夺取电磁频谱的控制权已成为战场制胜的关键手段。由于干扰环境的复杂性以及敌方在通信过程中采用多种抗干扰技术、人工智能技术,极大地增加了成功干扰的难度。值得庆幸的是,认知干扰概念的提出,拉近了对抗双方在博弈能力上的差距。特别是将强化学习理论用于通信干扰策略学习,使得干扰设备在与环境的交互过程中不断调整干扰策略,克服了未知因素对学习的影响,并最终实现最优干扰策略的学习。当前对干扰策略的研究仍存在一定的问题,突出体现在耗费过多交互次数以及应用场景局限性。本文针对不同场景下干扰策略的学习方法展开研究,主要研究内容如下:(1)复杂未知的电磁环境致使目标信号的星座图发生不同程度的畸变,经典的最佳干扰策略往往并非最佳。为了学习到受畸变信号的最佳干扰样式,提出了一种针对高阶调制信号的通用干扰样式构造方法,通过正交分解的方式构造不同种类的干扰样式。现有强化学习算法用于最优干扰策略学习,试错次数多,收敛速度慢,论文分别从搜索和预测两个角度提高最优干扰策略学习的时效性。在搜索策略研究方面:(1)利用离散划分后干扰动作之间的相关特性,提出了一种基于正强化学习的干扰策略学习算...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:194 页
【学位级别】:博士
【部分图文】:
马尔科
赌场里的老虎机不管是从多台单臂老虎机中挑选老虎机,还是从一台多臂老虎机上选择摇杆,
【参考文献】:
期刊论文
[1]认知电子战体系结构与技术[J]. 王沙飞,鲍雁飞,李岩. 中国科学:信息科学. 2018(12)
[2]16-QAM信号的最佳干扰分析[J]. 孙志国,徐天宇,邓昌青,宁晓燕,郭黎利. 哈尔滨工程大学学报. 2018(07)
[3]未知拓扑无线自组网络多节点干扰决策算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举. 西安交通大学学报. 2018(06)
[4]采用双层强化学习的干扰决策算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举. 西安交通大学学报. 2018(02)
[5]基于正强化学习和正交分解的干扰策略选择算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举. 系统工程与电子技术. 2018(03)
[6]一种基于离散插值的多项式曲线逼近有理曲线的方法[J]. 李光耀,杨连喜,徐晨东. 浙江大学学报(理学版). 2017(06)
[7]基于强化学习的无线自组网络多节点干扰策略[J]. 颛孙少帅,杨俊安,刘辉,黄科举. 控制与决策. 2018(07)
[8]样条插值法在轮对压装曲线处理中的应用[J]. 肖峻,杨铮,杜兆勇,黄海涛. 机床与液压. 2017(08)
[9]多干扰机反向交叉眼干扰分析[J]. 王彩云,何志勇,宫俊. 系统工程与电子技术. 2017(07)
[10]多机协同电子战规划压制干扰布阵研究[J]. 张欢,杨任农,吴军,李秋妮,傅修竹,孙长月. 系统工程与电子技术. 2017(03)
博士论文
[1]基于智能体的多机器人系统学习方法研究[D]. 刘强.哈尔滨工业大学 2016
[2]基于值函数估计的强化学习算法研究[D]. 陈兴国.南京大学 2013
[3]基于构造型前馈神经网络的函数逼近与应用[D]. 侯木舟.中南大学 2009
硕士论文
[1]基于强化学习的移动机器人自适应模型研究[D]. 岳文应.浙江理工大学 2018
[2]基于多智能体强化学习的足球机器人决策策略研究[D]. 丁明刚.合肥工业大学 2017
本文编号:3297386
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:194 页
【学位级别】:博士
【部分图文】:
马尔科
赌场里的老虎机不管是从多台单臂老虎机中挑选老虎机,还是从一台多臂老虎机上选择摇杆,
【参考文献】:
期刊论文
[1]认知电子战体系结构与技术[J]. 王沙飞,鲍雁飞,李岩. 中国科学:信息科学. 2018(12)
[2]16-QAM信号的最佳干扰分析[J]. 孙志国,徐天宇,邓昌青,宁晓燕,郭黎利. 哈尔滨工程大学学报. 2018(07)
[3]未知拓扑无线自组网络多节点干扰决策算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举. 西安交通大学学报. 2018(06)
[4]采用双层强化学习的干扰决策算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举. 西安交通大学学报. 2018(02)
[5]基于正强化学习和正交分解的干扰策略选择算法[J]. 颛孙少帅,杨俊安,刘辉,黄科举. 系统工程与电子技术. 2018(03)
[6]一种基于离散插值的多项式曲线逼近有理曲线的方法[J]. 李光耀,杨连喜,徐晨东. 浙江大学学报(理学版). 2017(06)
[7]基于强化学习的无线自组网络多节点干扰策略[J]. 颛孙少帅,杨俊安,刘辉,黄科举. 控制与决策. 2018(07)
[8]样条插值法在轮对压装曲线处理中的应用[J]. 肖峻,杨铮,杜兆勇,黄海涛. 机床与液压. 2017(08)
[9]多干扰机反向交叉眼干扰分析[J]. 王彩云,何志勇,宫俊. 系统工程与电子技术. 2017(07)
[10]多机协同电子战规划压制干扰布阵研究[J]. 张欢,杨任农,吴军,李秋妮,傅修竹,孙长月. 系统工程与电子技术. 2017(03)
博士论文
[1]基于智能体的多机器人系统学习方法研究[D]. 刘强.哈尔滨工业大学 2016
[2]基于值函数估计的强化学习算法研究[D]. 陈兴国.南京大学 2013
[3]基于构造型前馈神经网络的函数逼近与应用[D]. 侯木舟.中南大学 2009
硕士论文
[1]基于强化学习的移动机器人自适应模型研究[D]. 岳文应.浙江理工大学 2018
[2]基于多智能体强化学习的足球机器人决策策略研究[D]. 丁明刚.合肥工业大学 2017
本文编号:3297386
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3297386.html