当前位置:主页 > 科技论文 > 自动化论文 >

基于增强学习算法的移动机器人导航控制及实现

发布时间:2021-01-10 19:15
  随着移动机器人应用领域的拓展,要求移动机器人能适应在未知环境下工作。移动机器人自主导航和轨迹跟踪能力是提高移动机器人适应性关键技术。本文以差速轮式移动机器人为研究对象,以增强学习为理论基础,研究移动机器人在未知环境下自主导航和轨迹跟踪控制器优化方法。应用所提出的导航方法,结合单目视觉技术实现自主设计的移动机器人在障碍物环境中导航。针对移动机器人导航问题,提出一种基于增强学习反应式导航策略。首先分析移动机器人导航环境特点,建立移动机器人导航Markov模型,优化Markov模型中状态空间和回报函数设计,用BP神经网络逼近状态值和策略空间来解决连续状态空间“维数灾难”问题。由于Q-学习算法收敛速度较慢,移动机器人学习训练采用Actor-Critic策略梯度算法,最后设计Matlab仿真实验证明提出的导航方法使得移动机器人可以根据外界传感器获取的环境信息实时路径规划,自主避障,同传统方法相比学习效率更高,具有更强的泛化能力和环境适应力。针对轮式移动机器人轨迹跟踪问题,提出一种基于增强学习算法的移动机器人轨迹跟踪控制方法。首先建立移动机器人运动学模型和动力学模型,分别建立运动学控制器和动力学控... 

【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校

【文章页数】:99 页

【学位级别】:硕士

【部分图文】:

基于增强学习算法的移动机器人导航控制及实现


磁导航巡视机器人3)光学导航

视觉导航,移动机器人导航,算法研究,现状


这种导航在移动机器人行驶环境中安装已体上安装激光发射器,通过检测不同角度反从而实现移动机器人导引。该导航方式优点移动机器人行驶路径,适用于复杂工作环境。这种导航方式在移动机器人上安设陀螺仪器人通过陀螺仪偏差信号和地面定位块信号高,路径规划简易等优点,是移动机器人导不成熟,成本较高。。视觉导航工作原理是:移动机器人通过车信息,通过图像信息提取移动机器人位姿,人类导航方式,适用范围广、路径设置灵活导航方式。缺点是车载视觉系统技术不成熟人快速准确环境识别。由于视觉提供的环境关键,是移动机器人自主导航最重要的技术

算法结构,势函数


图 1-3Actor-critic 算法结构图回报设计(Reward Shaping)核心思想是利用各种少动作的奖励边界,加快学习[12]。启发式回报函回报信号稀疏和信度分配难题。启发式函数将值加上启发式的附加回报值。附加回报值设计要的影响,AndrewNg 等给出 TD 算法中安全使并提出基于回报势函数(Potentialfunction)的引导通过限定附加回报函数 为某个势函数的φ( s),将附加回报函数设计转变到势函数设计,验知识确定为定量模型。立即回报函数和引导,若模型没有先验知识,设计将会很困难,因e shaping 知识,该方法利用过程经验设计势函数机器学习中其他方法最大优点是不需要给定各能体可以通过与环境的互动中自我学习,在求解

【参考文献】:
期刊论文
[1]基于ARM的视觉导航AGV的设计与实现[J]. 张合贵,马家辰.  信息技术. 2016(07)
[2]基于模糊控制的AGV轨迹跟踪研究[J]. 杨远航,方庆琯.  起重运输机械. 2011(02)
[3]基于单目视觉的移动机器人导航算法研究进展[J]. 夏庭锴,杨明,杨汝清.  控制与决策. 2010(01)
[4]强化学习方法在移动机器人导航中的应用[J]. 陆军,徐莉,周小平.  哈尔滨工程大学学报. 2004(02)

博士论文
[1]轮式机器人的移动系统建模及基于模型学习的跟踪控制研究[D]. 宋兴国.哈尔滨工业大学 2015
[2]视觉导航的轮式移动机器人运动控制技术研究[D]. 武星.南京航空航天大学 2010
[3]增强学习及其在移动机器人导航与控制中的应用研究[D]. 徐昕.国防科学技术大学 2002

硕士论文
[1]室内全向移动机器人系统设计及导航方法研究[D]. 王超.哈尔滨工业大学 2017
[2]视觉导航AGV定位与路径规划技术研究[D]. 郑少华.华南理工大学 2016
[3]基于强化学习的移动机器人路径规划研究[D]. 高慧.西南交通大学 2016
[4]基于强化学习的移动机器人路径规划研究与实现[D]. 韦如明.华南理工大学 2015
[5]基于机器视觉的AGV结构设计与导航算法研究[D]. 凌云志.华南理工大学 2015
[6]基于STM32的自动引导小车(AGV)导航系统的研究[D]. 孙洪伟.武汉理工大学 2014
[7]基于智能手机的机器人视觉避障系统研究[D]. 向文辉.中国科学技术大学 2014
[8]基于单目视觉的无人车障碍物识别技术研究[D]. 徐红宾.大连理工大学 2014
[9]轮式移动机器人控制系统设计[D]. 王珊珊.南京理工大学 2013
[10]分层强化学习研究及其在机械臂避障问题中的应用[D]. 金旭东.重庆大学 2012



本文编号:2969260

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2969260.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户56bf3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com