基于深度强化学习的室内移动机器人路径规划研究
发布时间:2023-04-02 00:45
为提高机器人的自主性,目前越来越多的算法被提出来,作为机器人导航的关键性算法,路径规划算法显得格外重要。虽然目前传统的路径规划算法研究也有取得相关的成果,但是传统算法缺少一种环境感知和环境学习的能力。本文在人工智能相关技术理论的背景下,对实现机器人自主路径规划的先进算法展开了进一步的研究。本文研究的是基于深度强化学习的路径规划方法,利用深度学习强大的学习能力和强化学习强大的决策能力,基于深度强化学习方法能够很好地实现智能化的路径规划。为实现更加智能的机器人室内环境路径规划,本文在DDPG(Deep Deterministic Policy Gradient)算法的基础上做了部分改进,算法改进点如下:(1)在深度强化学习DDPG算法的基础上提出了一种基于多步状态值的评论家网络算法改进,使训练的效果更加稳定、出色。(2)在基于深度强化学习的神经网络模型部分也提出了改进的方法,引入Radam算法实现更加高效的神经网络参数训练。(3)借鉴了A3C等相关理论,在改进的DDPG算法基础上,提出了基于异步的训练方法。(4)在深度学习的基础上,引入具有收敛性更快的迁移学习算法,应用到改进的DDPG算法...
【文章页数】:139 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
变量注释表
1 绪论
1.1 概述
1.2 机器人路径规划研究现状
1.3 本文研究内容
2 强化学习算法
2.1 强化学习八要素
2.2 马尔科夫决策过程
2.3 基于值函数的强化学习算法
2.4 基于策略的强化学习方法
2.5 本章小结
3 深度强化学习算法
3.1 深度学习算法
3.2 深度强化学习算法
3.3 本章小结
4 基于DRL的室内路径规划算法改进
4.1 深度强化学习中的神经网络改进
4.2 结合迁移学习的DRL算法改进
4.3 基于DDPG的目标价值网络算法改进
4.4 基于异步方法的算法改进
4.5 本章小结
5 基于改进算法的实验过程
5.1 室内仿真环境搭建
5.2 室内机器人运动控制
5.3 基于改进算法的仿真
5.4 基于改进算法的场地测试
5.5 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
作者简历
学位论文数据集
本文编号:3778185
【文章页数】:139 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
变量注释表
1 绪论
1.1 概述
1.2 机器人路径规划研究现状
1.3 本文研究内容
2 强化学习算法
2.1 强化学习八要素
2.2 马尔科夫决策过程
2.3 基于值函数的强化学习算法
2.4 基于策略的强化学习方法
2.5 本章小结
3 深度强化学习算法
3.1 深度学习算法
3.2 深度强化学习算法
3.3 本章小结
4 基于DRL的室内路径规划算法改进
4.1 深度强化学习中的神经网络改进
4.2 结合迁移学习的DRL算法改进
4.3 基于DDPG的目标价值网络算法改进
4.4 基于异步方法的算法改进
4.5 本章小结
5 基于改进算法的实验过程
5.1 室内仿真环境搭建
5.2 室内机器人运动控制
5.3 基于改进算法的仿真
5.4 基于改进算法的场地测试
5.5 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
作者简历
学位论文数据集
本文编号:3778185
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3778185.html