基于Q(λ)-learning的移动机器人路径规划改进探索方法
发布时间:2021-01-24 03:55
强化学习算法广泛的应用于路径规划,使移动机器人能够与环境交互并实现自主避障、获取最优路径。传统Q(λ)-learning算法所采用的探索策略存在探索利用平衡问题,由于收敛过早,往往得不到最优解。本文提出一种动态调整探索因子的探索方法,以探索成功率判断机器人对环境的熟悉程度,指导探索过程,从而找到最优路径;采用栅格法建立地图。通过仿真和对比试验证明了该方法可以得到全局最优策略。
【文章来源】:自动化与仪表. 2019,34(11)
【文章页数】:4 页
【文章目录】:
1 基于Q(λ)-learning的改进探索方法
2 仿真试验与结果分析
3 结语
【参考文献】:
期刊论文
[1]结合神经网络和Q(λ)-learning的路径规划方法[J]. 王健,张平陆,赵忠英,程晓鹏. 自动化与仪表. 2019(09)
[2]基于神经网络的强化学习在避障中的应用[J]. 乔俊飞,侯占军,阮晓钢. 清华大学学报(自然科学版). 2008(S2)
[3]基于模糊逻辑的机器人路径规划[J]. 毕盛,朱金辉,闵华清,钟汉如. 机电产品开发与创新. 2006(01)
硕士论文
[1]Qlearning强化学习算法的改进及应用研究[D]. 马朋委.安徽理工大学 2016
[2]基于增强学习的移动机器人动态路径规划算法研究[D]. 李斯定.国防科学技术大学 2015
本文编号:2996524
【文章来源】:自动化与仪表. 2019,34(11)
【文章页数】:4 页
【文章目录】:
1 基于Q(λ)-learning的改进探索方法
2 仿真试验与结果分析
3 结语
【参考文献】:
期刊论文
[1]结合神经网络和Q(λ)-learning的路径规划方法[J]. 王健,张平陆,赵忠英,程晓鹏. 自动化与仪表. 2019(09)
[2]基于神经网络的强化学习在避障中的应用[J]. 乔俊飞,侯占军,阮晓钢. 清华大学学报(自然科学版). 2008(S2)
[3]基于模糊逻辑的机器人路径规划[J]. 毕盛,朱金辉,闵华清,钟汉如. 机电产品开发与创新. 2006(01)
硕士论文
[1]Qlearning强化学习算法的改进及应用研究[D]. 马朋委.安徽理工大学 2016
[2]基于增强学习的移动机器人动态路径规划算法研究[D]. 李斯定.国防科学技术大学 2015
本文编号:2996524
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2996524.html