基于深度强化学习的室内移动机器人路径规划研究

发布时间：2023-04-02 00:45

　　为提高机器人的自主性,目前越来越多的算法被提出来,作为机器人导航的关键性算法,路径规划算法显得格外重要。虽然目前传统的路径规划算法研究也有取得相关的成果,但是传统算法缺少一种环境感知和环境学习的能力。本文在人工智能相关技术理论的背景下,对实现机器人自主路径规划的先进算法展开了进一步的研究。本文研究的是基于深度强化学习的路径规划方法,利用深度学习强大的学习能力和强化学习强大的决策能力,基于深度强化学习方法能够很好地实现智能化的路径规划。为实现更加智能的机器人室内环境路径规划,本文在DDPG(Deep Deterministic Policy Gradient)算法的基础上做了部分改进,算法改进点如下:(1)在深度强化学习DDPG算法的基础上提出了一种基于多步状态值的评论家网络算法改进,使训练的效果更加稳定、出色。(2)在基于深度强化学习的神经网络模型部分也提出了改进的方法,引入Radam算法实现更加高效的神经网络参数训练。(3)借鉴了A3C等相关理论,在改进的DDPG算法基础上,提出了基于异步的训练方法。(4)在深度学习的基础上,引入具有收敛性更快的迁移学习算法,应用到改进的DDPG算法...

【文章页数】：139 页

【学位级别】：硕士

【文章目录】：
致谢
摘要
abstract
变量注释表
1 绪论
    1.1 概述
    1.2 机器人路径规划研究现状
    1.3 本文研究内容
2 强化学习算法
    2.1 强化学习八要素
    2.2 马尔科夫决策过程
    2.3 基于值函数的强化学习算法
    2.4 基于策略的强化学习方法
    2.5 本章小结
3 深度强化学习算法
    3.1 深度学习算法
    3.2 深度强化学习算法
    3.3 本章小结
4 基于DRL的室内路径规划算法改进
    4.1 深度强化学习中的神经网络改进
    4.2 结合迁移学习的DRL算法改进
    4.3 基于DDPG的目标价值网络算法改进
    4.4 基于异步方法的算法改进
    4.5 本章小结
5 基于改进算法的实验过程
    5.1 室内仿真环境搭建
    5.2 室内机器人运动控制
    5.3 基于改进算法的仿真
    5.4 基于改进算法的场地测试
    5.5 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
作者简历
学位论文数据集

本文编号：3778185

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/guanlilunwen/lindaojc/3778185.html

上一篇：基于AHP层次分析法建立的开源软件许可证决策模型
下一篇：严某浩组织、领导黑社会性质组织案的刑法学分析

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|