当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Q(λ)-learning的移动机器人路径规划改进探索方法

发布时间:2021-01-24 03:55
  强化学习算法广泛的应用于路径规划,使移动机器人能够与环境交互并实现自主避障、获取最优路径。传统Q(λ)-learning算法所采用的探索策略存在探索利用平衡问题,由于收敛过早,往往得不到最优解。本文提出一种动态调整探索因子的探索方法,以探索成功率判断机器人对环境的熟悉程度,指导探索过程,从而找到最优路径;采用栅格法建立地图。通过仿真和对比试验证明了该方法可以得到全局最优策略。 

【文章来源】:自动化与仪表. 2019,34(11)

【文章页数】:4 页

【文章目录】:
1 基于Q(λ)-learning的改进探索方法
2 仿真试验与结果分析
3 结语


【参考文献】:
期刊论文
[1]结合神经网络和Q(λ)-learning的路径规划方法[J]. 王健,张平陆,赵忠英,程晓鹏.  自动化与仪表. 2019(09)
[2]基于神经网络的强化学习在避障中的应用[J]. 乔俊飞,侯占军,阮晓钢.  清华大学学报(自然科学版). 2008(S2)
[3]基于模糊逻辑的机器人路径规划[J]. 毕盛,朱金辉,闵华清,钟汉如.  机电产品开发与创新. 2006(01)

硕士论文
[1]Qlearning强化学习算法的改进及应用研究[D]. 马朋委.安徽理工大学 2016
[2]基于增强学习的移动机器人动态路径规划算法研究[D]. 李斯定.国防科学技术大学 2015



本文编号:2996524

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2996524.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dcb6b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com