深度强化学习在室内无人机目标搜索中的应用
发布时间:2023-04-18 20:47
针对室内无人机随机目标搜索效率不高、准确率低等问题,提出了一种基于空间位置标注的好奇心驱动的深度强化学习方法。用正六边形对探索空间进行区域划分,并标记无人机在各区域的访问次数,将其作为好奇心,产生内部奖励,以鼓励无人机不断探索新领域,有效避免其陷入到局部区域;训练时采用近端策略优化算法(PPO)优化神经网络参数,该算法能使无人机更快找到最优搜索策略,较好躲避障碍物,有效缩短训练周期,提升搜索效率和准确率。
【文章页数】:5 页
【文章目录】:
1 引言
2 仿真环境和任务介绍
3 基于深度强化学习的室内无人机目标搜索
3.1 PPO算法
3.2 好奇心驱动模型
3.3 基于空间位置标注的好奇心驱动方法
4 仿真实例
4.1 Agent状态空间及奖励规则设置
4.2 实验结果及分析
5 结束语
本文编号:3793007
【文章页数】:5 页
【文章目录】:
1 引言
2 仿真环境和任务介绍
3 基于深度强化学习的室内无人机目标搜索
3.1 PPO算法
3.2 好奇心驱动模型
3.3 基于空间位置标注的好奇心驱动方法
4 仿真实例
4.1 Agent状态空间及奖励规则设置
4.2 实验结果及分析
5 结束语
本文编号:3793007
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3793007.html