基于Q（λ）-learning的移动机器人路径规划改进探索方法

发布时间：2021-01-24 03:55

　　强化学习算法广泛的应用于路径规划,使移动机器人能够与环境交互并实现自主避障、获取最优路径。传统Q（λ）-learning算法所采用的探索策略存在探索利用平衡问题,由于收敛过早,往往得不到最优解。本文提出一种动态调整探索因子的探索方法,以探索成功率判断机器人对环境的熟悉程度,指导探索过程,从而找到最优路径;采用栅格法建立地图。通过仿真和对比试验证明了该方法可以得到全局最优策略。

【文章来源】：自动化与仪表. 2019,34(11)

【文章页数】：4 页

【文章目录】：
1 基于Q（λ）-learning的改进探索方法
2 仿真试验与结果分析
3 结语

【参考文献】：
期刊论文
[1]结合神经网络和Q（λ）-learning的路径规划方法[J]. 王健,张平陆,赵忠英,程晓鹏.  自动化与仪表. 2019(09)
[2]基于神经网络的强化学习在避障中的应用[J]. 乔俊飞,侯占军,阮晓钢.  清华大学学报(自然科学版). 2008(S2)
[3]基于模糊逻辑的机器人路径规划[J]. 毕盛,朱金辉,闵华清,钟汉如.  机电产品开发与创新. 2006(01)

硕士论文
[1]Qlearning强化学习算法的改进及应用研究[D]. 马朋委.安徽理工大学 2016
[2]基于增强学习的移动机器人动态路径规划算法研究[D]. 李斯定.国防科学技术大学 2015

本文编号：2996524

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2996524.html

上一篇：多类型观测任务的多星协同规划问题研究
下一篇：基于分解的多目标组合优化算法的研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|