基于增强学习的2D双足机器人步行控制系统研究
发布时间:2021-08-09 01:22
2D双足机器人步行控制是机器人研究领域关键性的基础研究问题之一。对于实际的双足机器人由于其结构复杂一般难以为其建立精确的动力学模型,所以传统的基于模型的分析法很难取得较好的控制效果。随着近些年来智能算法的兴起,研究者们逐渐在双足机器人步行控制中引入增强学习算法,但现行的基于增强学习的步行控制系统或要加入参考步态而不能完全脱离机器人的动力学模型,或仅能处理离散状态空间和动作空间的情形无法实现精确的控制。因此,本文提出了一个基于均值-异步的优势动作-评论(Mean-Asynchronous Advantage Actor-Critic,M-A3C)算法的2D双足动态步行学习方法,该方法无需引入参考步态并且能直接处理连续空间问题。在分析了2D双足机器人动态步行过程的基础上,本文对原始的最简行走模型进行了改进提出了基于脉冲推力和髋部驱动的带伸缩膝关节的最简行走模型,并获得该模型的一个一周期步态。依据该抽象的行走模型,本文设计制作了一个带伸缩膝关节的2D双足机器人及其在物理仿真平台中的虚拟版本以用于测试本文提出的动态步行学习方法。本文提出的动态步行学习方法的核心是M-A3C算法,该算法是本文基于...
【文章来源】:重庆邮电大学重庆市
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
机器人MABEL
生学原理应用于双足机器人步行控制中[8],采用中枢模式发生器(Centralerator , CPG)通过神经网络模型的离线训练和在线修正来控制机器人的步于仿生学的控制方法需要采集人类步行的数据,而由于人类自身生理结器人存在差异,采集的数据往往不能与机器人很好地匹配。4. 混合零动态控制方法J.W.Grizzle 等人提出利用混合零动态和虚拟限制条件控制二维欠驱动双走[2,9],随后 Chevallereau 等人将此类方法推广到三维欠驱动机器人的步0]。采用该步行控制方法的机器人以美国密歇根大学的 MABEL 和最新的人最为著名,分别如图 1.2 和图 1.3 所示。该控制方法需要对双足机器人非线性模型,而对于结构繁杂的双足机器人一般很难建立准确的数学模果机器人结构发生变化整个机器人的数学模型需要再一次重新推导,这制器设计过程变得极为繁琐,不利于双足机器人的广泛应用。
cGeer 在 Mochon 和 McMah行器[3],该步行器实现了在斜了膝关节[4],同样也实现了在的诞生,被动动态行走理论特性实现周期步态步行,以具备爬坡、转弯和暂停的能些原因,Collins 等人在被动平面上的稳定行走[5],并提动动态行走理论设计实现了行走了 54 个小时、总里程达了驱动器,但此类步行器还
本文编号:3331074
【文章来源】:重庆邮电大学重庆市
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
机器人MABEL
生学原理应用于双足机器人步行控制中[8],采用中枢模式发生器(Centralerator , CPG)通过神经网络模型的离线训练和在线修正来控制机器人的步于仿生学的控制方法需要采集人类步行的数据,而由于人类自身生理结器人存在差异,采集的数据往往不能与机器人很好地匹配。4. 混合零动态控制方法J.W.Grizzle 等人提出利用混合零动态和虚拟限制条件控制二维欠驱动双走[2,9],随后 Chevallereau 等人将此类方法推广到三维欠驱动机器人的步0]。采用该步行控制方法的机器人以美国密歇根大学的 MABEL 和最新的人最为著名,分别如图 1.2 和图 1.3 所示。该控制方法需要对双足机器人非线性模型,而对于结构繁杂的双足机器人一般很难建立准确的数学模果机器人结构发生变化整个机器人的数学模型需要再一次重新推导,这制器设计过程变得极为繁琐,不利于双足机器人的广泛应用。
cGeer 在 Mochon 和 McMah行器[3],该步行器实现了在斜了膝关节[4],同样也实现了在的诞生,被动动态行走理论特性实现周期步态步行,以具备爬坡、转弯和暂停的能些原因,Collins 等人在被动平面上的稳定行走[5],并提动动态行走理论设计实现了行走了 54 个小时、总里程达了驱动器,但此类步行器还
本文编号:3331074
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3331074.html