当前位置:主页 > 科技论文 > 自动化论文 >

机器人足球行为控制学习算法的研究

发布时间:2018-11-21 14:27
【摘要】:机器人足球作为人工智能的一项重大挑战,集合了多类热门研究于一身,是目前人工智能、多Agent系统研究的一个标准平台。机器人足球智能可以从多Agnet协作、单机器人行为策略决策和行为动作优化等多个方向研究。本文着重于足球机器人行为动作自主学习方向,引入强化学习算法,并针对多种足球机器人行为的强化学习进行仿真,验证了强化学习在足球机器人行为动作优化上的可行性。本文首先概括的介绍了机器人足球系统,对机器人足球的多个智能化研究方向进行了阐述。介绍了传统足球机器人行为动作的实现方式,说明了其方法的不足,提出了使用强化学习解决足球机器人行为控制上所面临的问题的思路。然后对强化学习进行了详细的阐述,从Markov决策过程开始,引出了针对离散状态空间Q学习算法,并针对连续状态空间介绍了连续逼近法在强化学习中的应用,并介绍了基于多层前馈神经网络的强化学习算法的实现过程。接着针对足球机器人截球行为,介绍了基于CMAC网络强化学习算法。CMAC网络具有结构简单、学习速度快的特性。对足球机器人截球的实现做仿真,验证了该算法的有效性。根据CMAC网络的不足,对CMAC网络做出了改进,实现了神经网络输出的连续逼近。使用基于改进后的连续CMAC网络的强化学习再次对足球机器人截球进行了仿真。然后针对足球机器人的躲避动态障碍,提出了使用并行连续CMAC的强化学习算法,避免了高维输入状态空间导致的维数灾难。最后为了实现足球机器人以指定方向趋近目标点的PID控制,将Actor-Critic学习算法应用在PID控制中,最终实现了足球机器人以指定方向趋近目标点的自适应PID控制的仿真。
[Abstract]:As an important challenge of artificial intelligence, robot soccer is a standard platform for the research of artificial intelligence and multi-Agent system. Robot soccer intelligence can be studied from multiple Agnet collaboration, single robot behavior strategy decision and behavioral action optimization. This paper focuses on the autonomous learning direction of soccer robot behavior, introduces reinforcement learning algorithm, and simulates the reinforcement learning of various soccer robot behaviors, which verifies the feasibility of reinforcement learning in the optimization of soccer robot behavior. In this paper, the robot soccer system is introduced, and several intelligent research directions of robot soccer are described. This paper introduces the implementation of the traditional soccer robot behavior, explains the shortcomings of the method, and puts forward the idea of using reinforcement learning to solve the problem of the soccer robot behavior control. Then the reinforcement learning is elaborated in detail. Starting from the Markov decision-making process, the Q learning algorithm for discrete state space is introduced, and the application of continuous approximation method in reinforcement learning is introduced for continuous state space. The implementation of reinforcement learning algorithm based on multilayer feedforward neural network is introduced. Then the reinforcement learning algorithm based on CMAC network is introduced for soccer robot truncation. CMAC network has the characteristics of simple structure and fast learning speed. The simulation of soccer robot truncation is carried out, and the validity of the algorithm is verified. According to the deficiency of CMAC network, the CMAC network is improved to realize the continuous approximation of the output of neural network. The reinforcement learning based on the improved continuous CMAC network is used to simulate the soccer robot again. Then a reinforcement learning algorithm based on parallel continuous CMAC is proposed to avoid the dimensionality disaster caused by high-dimensional input state space in order to avoid the dynamic obstacle of soccer robot. Finally, in order to realize the PID control of the soccer robot approaching the target point in the specified direction, the Actor-Critic learning algorithm is applied to the PID control. Finally, the simulation of the adaptive PID control of the soccer robot approaching the target point in the specified direction is realized.
【学位授予单位】:北方工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP242

【相似文献】

相关期刊论文 前10条

1 贾屹峰;滨化杯第二届全国机器人足球锦标赛[J];机器人技术与应用;2000年06期

2 凌凤琪,柳长安,鲍国超;机器人足球仿真比赛中碰撞后行为的研究[J];计算机应用研究;2003年12期

3 洪炳熔;机器人足球的最终目标及其实现途径[J];华中科技大学学报(自然科学版);2004年S1期

4 ;机器人足球表演[J];中国制造业信息化;2005年11期

5 王朝辉;周峰;;机器人足球射门动作研究[J];大众科技;2006年01期

6 ;机器人足球世界杯[J];国防科技;2006年07期

7 ;仿真机器人足球程序设计大赛落幕[J];华中科技大学学报(自然科学版);2008年02期

8 ;我校学生在世界杯机器人足球大赛中勇夺一金两银[J];华中科技大学学报(自然科学版);2008年09期

9 陈婷婷;张彦铎;;机器人足球仿真比赛平台中网络通信问题研究[J];武汉工程大学学报;2009年03期

10 张润梅;龚剑;;基于机器人足球的大学生创新素质培养的探索与实践[J];计算机教育;2009年02期

相关会议论文 前10条

1 张小川;王牛;肖朝辉;雷李;;基于总体的机器人足球训练方案的思考[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年

2 冯挺;方帅;徐心和;;面向用户的机器人足球策略编辑器设计[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年

3 火凤梅;;徐汇区中小幼学生虚拟机器人足球编程科教活动方案[A];科学教育的实践与探索[C];2012年

4 徐心和;曹洋;薛方正;;机器人足球——小型高科技对抗平台[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年

5 张小川;纪纲;肖朝辉;成卫;;基于图象处理的机器人足球感觉系统[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年

6 王行甫;庄严;陈小平;;机器人足球与大学计算机教育的初步思考[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年

7 符海东;梁应毅;;机器人足球策略中的截球动作设计[A];2005中国机器人大赛论文集[C];2005年

8 刘斐;卢惠民;郑志强;;一种稳健的机器人足球场地标示线提取方法[A];2007年足球机器人大会论文集[C];2007年

9 黄鹏;杨鹏;黄军雷;刘作军;;几种运动规划策略在机器人足球中的应用[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年

10 卓茗;唐华斌;;机器人足球视觉系统精度提高算法[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年

相关重要报纸文章 前10条

1 崔峰;机器人足球的开拓者[N];人民日报海外版;2003年

2 洪炳昒;发展机器人足球 推动信息化建设[N];光明日报;2007年

3 石松;中国机器人足球的开拓者[N];科技日报;2006年

4 ;我国机器人足球现状[N];经济参考报;2000年

5 谢远景 闫佳;机器人足球:冲出亚洲走向世界[N];科技日报;2005年

6 本报记者  张亮;机器人足球世界杯能为我们带来什么?[N];科技日报;2006年

7 东北大学人工智能与机器人研究所所长 徐心和;机器人足球[N];科技日报;2001年

8 记者 李晓明 张振;“华煤杯”第七届全国机器人足球锦标赛暨’2006中国·平凉崆峒文化旅游节开幕[N];平凉日报;2006年

9 本版编辑 国际机器人足球联盟(FIRA)副主席 FIRA中国分会会长 洪炳昒 甘肃省人大常委会副主任 丁泽生 中国人工智能学会理事长 钟义信 平凉市委副书记、市长 马学军;在“华煤标”第七届全国机器人足球锦标赛暨’2006中国·平凉崆峒文化旅游节开幕式上的讲话(摘要)[N];平凉日报;2006年

10 赵s,

本文编号:2347236


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2347236.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d0e29***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com