当前位置:主页 > 管理论文 > 领导决策论文 >

基于深度强化学习的室内移动机器人路径规划研究

发布时间:2023-04-02 00:45
  为提高机器人的自主性,目前越来越多的算法被提出来,作为机器人导航的关键性算法,路径规划算法显得格外重要。虽然目前传统的路径规划算法研究也有取得相关的成果,但是传统算法缺少一种环境感知和环境学习的能力。本文在人工智能相关技术理论的背景下,对实现机器人自主路径规划的先进算法展开了进一步的研究。本文研究的是基于深度强化学习的路径规划方法,利用深度学习强大的学习能力和强化学习强大的决策能力,基于深度强化学习方法能够很好地实现智能化的路径规划。为实现更加智能的机器人室内环境路径规划,本文在DDPG(Deep Deterministic Policy Gradient)算法的基础上做了部分改进,算法改进点如下:(1)在深度强化学习DDPG算法的基础上提出了一种基于多步状态值的评论家网络算法改进,使训练的效果更加稳定、出色。(2)在基于深度强化学习的神经网络模型部分也提出了改进的方法,引入Radam算法实现更加高效的神经网络参数训练。(3)借鉴了A3C等相关理论,在改进的DDPG算法基础上,提出了基于异步的训练方法。(4)在深度学习的基础上,引入具有收敛性更快的迁移学习算法,应用到改进的DDPG算法...

【文章页数】:139 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
abstract
变量注释表
1 绪论
    1.1 概述
    1.2 机器人路径规划研究现状
    1.3 本文研究内容
2 强化学习算法
    2.1 强化学习八要素
    2.2 马尔科夫决策过程
    2.3 基于值函数的强化学习算法
    2.4 基于策略的强化学习方法
    2.5 本章小结
3 深度强化学习算法
    3.1 深度学习算法
    3.2 深度强化学习算法
    3.3 本章小结
4 基于DRL的室内路径规划算法改进
    4.1 深度强化学习中的神经网络改进
    4.2 结合迁移学习的DRL算法改进
    4.3 基于DDPG的目标价值网络算法改进
    4.4 基于异步方法的算法改进
    4.5 本章小结
5 基于改进算法的实验过程
    5.1 室内仿真环境搭建
    5.2 室内机器人运动控制
    5.3 基于改进算法的仿真
    5.4 基于改进算法的场地测试
    5.5 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
作者简历
学位论文数据集



本文编号:3778185

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3778185.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户99d6c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com