当前位置:主页 > 科技论文 > 自动化论文 >

基于深度强化学习的移动机器人导航策略研究

发布时间:2021-04-24 08:43
  针对移动机器人在复杂动态变化的环境下导航的局限性,采用了一种将深度学习和强化学习结合起来的深度强化学习方法;研究以在OpenCV平台下搭建的仿真环境的图像作为输入数据,输入至TensorFlow创建的卷积神经网络模型中处理,提取其中的机器人的动作状态信息,结合强化学习的决策能力求出最佳导航策略;仿真实验结果表明:在经过深度强化学习的方法训练后,移动机器人在环境发生了部分场景变化时,依然能够实现随机起点到随机终点的高效准确的导航。 

【文章来源】:计算机测量与控制. 2019,27(08)

【文章页数】:6 页

【文章目录】:
0 引言
1 相关研究
    1.1 卷积神经网络
    1.2 强化学习
        1.2.1 马尔科夫模型与贝尔曼方程
        1.2.2 策略迭代
        1.2.3 值迭代
    1.3 深度强化学习
        1.3.1 基于值函数
        1.3.2 基于策略梯度
2 基于DQN的移动机器人导航策略研究
    2.1 DQN网络参数预处理
    2.2 模型结构与图像处理过程
    2.3 DQN算法训练流程
    2.4 搜索与利用平衡策略
3 实验仿真与分析
    3.1 实验平台描述
    3.2 实验结果
        3.2.1 初始地图下的导航
        3.2.2 增量环境下的导航
4 结束语


【参考文献】:
期刊论文
[1]强化学习研究综述[J]. 高阳,陈世福,陆鑫.  自动化学报. 2004(01)



本文编号:3157054

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3157054.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bd8f0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com