深度强化学习在作战任务规划中的应用
发布时间:2021-10-23 11:36
针对军事(战术级)作战任务规划面临的战场环境复杂、信息不完全、不确定性大、策略复杂度高等挑战,梳理了作战任务规划基本概念和流程框架,介绍了深度强化学习的基本原理和发展现状,分析了深度强化学习在作战任务规划中场景识别、目标检测、行为判断、威胁评估、路径规划、火力分配等方面的应用,为作战任务规划的智能化发展提供了新的研究思路。
【文章来源】:飞航导弹. 2020,(04)北大核心
【文章页数】:6 页
【部分图文】:
作战任务规划OODA循环
2016年,麻省理工大学计算机科学与人工智能实验室公开了场景数据集Places,包含百万张不同场景图片,同时用AlexNet、GoogleNet、VGGNet等深度网络在该数据集上进行训练,得到的模型显著提高了场景识别的准确率,并公开了网络训练的模型参数,可将这些网络模型作为预训练模型在小样本战场场景数据集上进行迁移学习,找出输出结果可用的层,用这些层的输出作为输入对网络结构进行微调,训练一个参数量更小、规模也更小的网络模型,提高模型准确率和鲁棒性的同时缩短训练时长。3.1.2 目标检测
本文从作战任务规划的概念和框架出发,简要介绍了深度强化学习的原理和发展,分析了深度强化学习在作战任务规划中的应用,为未来作战任务规划信息化、智能化发展提出了新的研究思路。1 作战任务规划框架
【参考文献】:
期刊论文
[1]深度强化学习进展:从AlphaGo到AlphaGo Zero[J]. 唐振韬,邵坤,赵冬斌,朱圆恒. 控制理论与应用. 2017(12)
[2]深度强化学习综述[J]. 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进. 计算机学报. 2018(01)
本文编号:3453116
【文章来源】:飞航导弹. 2020,(04)北大核心
【文章页数】:6 页
【部分图文】:
作战任务规划OODA循环
2016年,麻省理工大学计算机科学与人工智能实验室公开了场景数据集Places,包含百万张不同场景图片,同时用AlexNet、GoogleNet、VGGNet等深度网络在该数据集上进行训练,得到的模型显著提高了场景识别的准确率,并公开了网络训练的模型参数,可将这些网络模型作为预训练模型在小样本战场场景数据集上进行迁移学习,找出输出结果可用的层,用这些层的输出作为输入对网络结构进行微调,训练一个参数量更小、规模也更小的网络模型,提高模型准确率和鲁棒性的同时缩短训练时长。3.1.2 目标检测
本文从作战任务规划的概念和框架出发,简要介绍了深度强化学习的原理和发展,分析了深度强化学习在作战任务规划中的应用,为未来作战任务规划信息化、智能化发展提出了新的研究思路。1 作战任务规划框架
【参考文献】:
期刊论文
[1]深度强化学习进展:从AlphaGo到AlphaGo Zero[J]. 唐振韬,邵坤,赵冬斌,朱圆恒. 控制理论与应用. 2017(12)
[2]深度强化学习综述[J]. 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进. 计算机学报. 2018(01)
本文编号:3453116
本文链接:https://www.wllwen.com/kejilunwen/jingguansheji/3453116.html