基于深度强化学习的移动机器人导航策略研究

发布时间：2021-04-24 08:43

　　针对移动机器人在复杂动态变化的环境下导航的局限性,采用了一种将深度学习和强化学习结合起来的深度强化学习方法;研究以在OpenCV平台下搭建的仿真环境的图像作为输入数据,输入至TensorFlow创建的卷积神经网络模型中处理,提取其中的机器人的动作状态信息,结合强化学习的决策能力求出最佳导航策略;仿真实验结果表明:在经过深度强化学习的方法训练后,移动机器人在环境发生了部分场景变化时,依然能够实现随机起点到随机终点的高效准确的导航。

【文章来源】：计算机测量与控制. 2019,27(08)

【文章页数】：6 页

【文章目录】：
0 引言
1 相关研究
    1.1 卷积神经网络
    1.2 强化学习
        1.2.1 马尔科夫模型与贝尔曼方程
        1.2.2 策略迭代
        1.2.3 值迭代
    1.3 深度强化学习
        1.3.1 基于值函数
        1.3.2 基于策略梯度
2 基于DQN的移动机器人导航策略研究
    2.1 DQN网络参数预处理
    2.2 模型结构与图像处理过程
    2.3 DQN算法训练流程
    2.4 搜索与利用平衡策略
3 实验仿真与分析
    3.1 实验平台描述
    3.2 实验结果
        3.2.1 初始地图下的导航
        3.2.2 增量环境下的导航
4 结束语

【参考文献】：
期刊论文
[1]强化学习研究综述[J]. 高阳,陈世福,陆鑫.  自动化学报. 2004(01)

本文编号：3157054

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3157054.html

上一篇：地面无人平台自主导航避障系统的研究与实现
下一篇：机器阅读理解中的多任务学习算法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|