基于深度强化学习的移动机器人导航策略研究
发布时间:2021-04-24 08:43
针对移动机器人在复杂动态变化的环境下导航的局限性,采用了一种将深度学习和强化学习结合起来的深度强化学习方法;研究以在OpenCV平台下搭建的仿真环境的图像作为输入数据,输入至TensorFlow创建的卷积神经网络模型中处理,提取其中的机器人的动作状态信息,结合强化学习的决策能力求出最佳导航策略;仿真实验结果表明:在经过深度强化学习的方法训练后,移动机器人在环境发生了部分场景变化时,依然能够实现随机起点到随机终点的高效准确的导航。
【文章来源】:计算机测量与控制. 2019,27(08)
【文章页数】:6 页
【文章目录】:
0 引言
1 相关研究
1.1 卷积神经网络
1.2 强化学习
1.2.1 马尔科夫模型与贝尔曼方程
1.2.2 策略迭代
1.2.3 值迭代
1.3 深度强化学习
1.3.1 基于值函数
1.3.2 基于策略梯度
2 基于DQN的移动机器人导航策略研究
2.1 DQN网络参数预处理
2.2 模型结构与图像处理过程
2.3 DQN算法训练流程
2.4 搜索与利用平衡策略
3 实验仿真与分析
3.1 实验平台描述
3.2 实验结果
3.2.1 初始地图下的导航
3.2.2 增量环境下的导航
4 结束语
【参考文献】:
期刊论文
[1]强化学习研究综述[J]. 高阳,陈世福,陆鑫. 自动化学报. 2004(01)
本文编号:3157054
【文章来源】:计算机测量与控制. 2019,27(08)
【文章页数】:6 页
【文章目录】:
0 引言
1 相关研究
1.1 卷积神经网络
1.2 强化学习
1.2.1 马尔科夫模型与贝尔曼方程
1.2.2 策略迭代
1.2.3 值迭代
1.3 深度强化学习
1.3.1 基于值函数
1.3.2 基于策略梯度
2 基于DQN的移动机器人导航策略研究
2.1 DQN网络参数预处理
2.2 模型结构与图像处理过程
2.3 DQN算法训练流程
2.4 搜索与利用平衡策略
3 实验仿真与分析
3.1 实验平台描述
3.2 实验结果
3.2.1 初始地图下的导航
3.2.2 增量环境下的导航
4 结束语
【参考文献】:
期刊论文
[1]强化学习研究综述[J]. 高阳,陈世福,陆鑫. 自动化学报. 2004(01)
本文编号:3157054
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3157054.html