强化学习算法在雷达智能抗干扰中的应用
发布时间:2020-12-22 22:46
雷达在工作过程中所应对的干扰场景复杂且多变,所具有的反干扰措施难以穷举。人工设计的反干扰流程与抑制策略在面对这些对抗场景时,由于受限于专家的经验知识,其反干扰性能难以保证。对此,文中从雷达抗干扰的应用需求出发,通过引入强化学习方法,提出一种基于强化学习模型的智能抗干扰方法。分别利用Q学习与Sarsa两种典型的强化学习算法对反干扰模型中的值函数进行了计算并迭代,使得反干扰策略具备了自主更新与优化功能。仿真结果表明,强化学习算法在训练过程中能够收敛并实现反干扰策略的优化。相比于传统的反干扰设计手段,雷达反干扰的智能化程度得到了有效提升。
【文章来源】:现代雷达. 2020年03期 北大核心
【文章页数】:6 页
【部分图文】:
强化学习模型原理框图
图2为智能反干扰强化学习模型训练过程示意图,图2由雷达常规信号处理部分与反干扰强化学习的训练部分组成。常规信号处理部分包括DBF与脉冲压缩等过程。训练部分包括干扰状态集合、雷达智能体(图2中虚线框部分,包含用于值函数迭代的训练算法以及用于存储值函数结果的知识库)、策略更新(采用ε-贪婪策略,即雷达以知识库为依据,以1-ε的概率选择当前值函数最大的反干扰措施,以ε的概率随机选择反干扰措施。训练通过对参数ε进行衰减从而完成策略的更新)、反干扰措施集合。图2中的模型训练过程描述如下:
针对上一节给出的干扰场景与反干扰措施集合,图4给出了人工设计反干扰策略的过程示意图。若不考虑各反干扰措施间组合方式的合理性,图4中的措施之间共具有C 4 1 +C 4 2 +C 4 3 +C 4 4 =10种排列组合方式,这些不同组合方式即对应着不同的反干扰策略。上述反干扰策略需要经过人工经验知识的判断以实现优化选择,策略优化过程的智能化程度不足,并且所设计出的反干扰策略的性能可能是次优的。图4 人工设计反干扰策略过程示意图
【参考文献】:
期刊论文
[1]基于Q-学习的智能雷达对抗[J]. 邢强,贾鑫,朱卫纲. 系统工程与电子技术. 2018(05)
[2]基于Q-学习算法的认知雷达对抗过程设计[J]. 李云杰,朱云鹏,高梅国. 北京理工大学学报. 2015(11)
[3]雷达智能抗干扰体系研究[J]. 王峰,雷志勇,黄桂根,陈庆,麻清华. 现代雷达. 2014(01)
[4]基于稀疏矩阵计算的外辐射源多径杂波抑制算法[J]. 王峰,傅有光,李明. 现代雷达. 2011(11)
本文编号:2932575
【文章来源】:现代雷达. 2020年03期 北大核心
【文章页数】:6 页
【部分图文】:
强化学习模型原理框图
图2为智能反干扰强化学习模型训练过程示意图,图2由雷达常规信号处理部分与反干扰强化学习的训练部分组成。常规信号处理部分包括DBF与脉冲压缩等过程。训练部分包括干扰状态集合、雷达智能体(图2中虚线框部分,包含用于值函数迭代的训练算法以及用于存储值函数结果的知识库)、策略更新(采用ε-贪婪策略,即雷达以知识库为依据,以1-ε的概率选择当前值函数最大的反干扰措施,以ε的概率随机选择反干扰措施。训练通过对参数ε进行衰减从而完成策略的更新)、反干扰措施集合。图2中的模型训练过程描述如下:
针对上一节给出的干扰场景与反干扰措施集合,图4给出了人工设计反干扰策略的过程示意图。若不考虑各反干扰措施间组合方式的合理性,图4中的措施之间共具有C 4 1 +C 4 2 +C 4 3 +C 4 4 =10种排列组合方式,这些不同组合方式即对应着不同的反干扰策略。上述反干扰策略需要经过人工经验知识的判断以实现优化选择,策略优化过程的智能化程度不足,并且所设计出的反干扰策略的性能可能是次优的。图4 人工设计反干扰策略过程示意图
【参考文献】:
期刊论文
[1]基于Q-学习的智能雷达对抗[J]. 邢强,贾鑫,朱卫纲. 系统工程与电子技术. 2018(05)
[2]基于Q-学习算法的认知雷达对抗过程设计[J]. 李云杰,朱云鹏,高梅国. 北京理工大学学报. 2015(11)
[3]雷达智能抗干扰体系研究[J]. 王峰,雷志勇,黄桂根,陈庆,麻清华. 现代雷达. 2014(01)
[4]基于稀疏矩阵计算的外辐射源多径杂波抑制算法[J]. 王峰,傅有光,李明. 现代雷达. 2011(11)
本文编号:2932575
本文链接:https://www.wllwen.com/kejilunwen/wltx/2932575.html