基于神经网络的三自由度直升机智能控制方法研究
发布时间:2021-02-16 22:05
近年来,小型无人机以其良好的机动性受到了欢迎,个人持有率极大的提高。广阔的商业前景使得飞行器的控制受到了更广泛的关注。合适的控制算法能结合硬件特点,发挥出系统最好的表现。而智能控制算法以其自适应性部分弥补了人工设计存在的不可建模误差,使获得适合系统的控制算法变得可能。本文选取的三自由度直升机系统具有典型的飞行器系统特点,同时易于采集数据,是验证智能控制算法应用于飞行器系统的理想平台。在此平台上,课题主要研究了基于神经网络的两种智能控制方法,反步自适应控制方法和强化学习控制方法,完成了如下工作:(1)在反步自适应方法中,使用神经网络逼近非线性部分,结合反步设计方法进行了控制器设计并对于设计后的系统给出了稳定性证明。在三自由度直升机的仿真及实物平台上进行了实验。达到了较好的控制效果。(2)在强化学习方法中,使用了执行器-评价器算法。引入动态指标对传统二值奖励进行了改进,避免了选择阈值的过程中出现的大初始误差和小运行误差难以同时兼顾的问题。改进的方法在仿真平台上进行了训练和验证,可以基本完成对时变信号的跟踪任务。课题成功将基于神经网络的两种智能控制方法应用于三自由度直升机上,并结合平台应用特...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
三自由度直升机
RBF 神经网络的使用。图 2-3 RBF 神经网络的拓扑结构图 2-3 为径向基函数神经网络(RBFNN)的拓扑结构图,为区别于前文的单个神经网络模型,这里1[ ,..., ]TqZ z z是神经网络输入向量,1[ ,..., ]T llW w w R是输入维数; 1( ) [ ,..., ( )]T llS Z s Z s Z R是基函数向量, l 1是权向量,其中q为节点数。结合前文对神经网络的介绍,使用图中标号可以得到( ) ( )TNNf Z W S Z(2-6)RBF 中的 is Z 一般为 Gauss 函数: 2( )exp , 1, 2,...,Ti iiiZ Zs Z i l (2-7)这里1 2[ , ,..., ]Ti i i iq 表示 Gauss 函数的中心向量,i 表示 Gauss 函数的宽度。可以证明
倾斜方向仿真跟随输出
【参考文献】:
期刊论文
[1]一种基于深度强化学习的自适应巡航控制算法[J]. 韩向敏,鲍泓,梁军,潘峰,玄祖兴. 计算机工程. 2018(07)
[2]基于深度强化学习的水下机器人最优轨迹控制[J]. 马琼雄,余润笙,石振宇,黄晁星,李腾龙. 华南师范大学学报(自然科学版). 2018(01)
[3]液压伺服位置系统的神经网络backstepping控制[J]. 方一鸣,李叶红,石胜利,李建雄. 电机与控制学报. 2014(06)
[4]基于迭代学习的BP神经网络权值训练算法[J]. 周小勇,翟春艳,李书臣,苏成利. 辽宁石油化工大学学报. 2013(04)
[5]基于混合型鲁棒输入训练神经网络的非线性数据校正方法及其应用[J]. 任少君,司风琪,李欢欢,徐治皋. 东南大学学报(自然科学版). 2013(02)
[6]基于小波神经网络自适应反推的永磁同步电机位置伺服控制[J]. 刘达,李木国. 电力自动化设备. 2013(02)
[7]基于双闭环的液压伺服系统控制[J]. 于建均,陈千平,孙亮,李建更,阮晓钢. 北京工业大学学报. 2007(03)
[8]BP网络的改进研究[J]. 远祯,罗波. 信息技术. 2006(02)
博士论文
[1]连续空间强化学习研究[D]. 张春元.电子科技大学 2016
[2]强化学习及其在机器人系统中的应用研究[D]. 陈学松.广东工业大学 2011
硕士论文
[1]基于深度强化学习的游戏控制算法研究与实现[D]. 颜志鹏.电子科技大学 2018
[2]不确定非线性系统的自适应神经网络跟踪控制[D]. 郑晓龙.渤海大学 2016
[3]面向连续状态的神经网络强化学习研究[D]. 王婷婷.中国矿业大学 2016
[4]对含输入饱和约束和未知信息的非线性系统的研究[D]. 张腾飞.北京交通大学 2016
[5]电液伺服系统的神经网络自整定PID控制策略研究[D]. 韦亚娟.燕山大学 2009
[6]一类非线性时滞系统的自适应控制器设计[D]. 郑健.中国石油大学 2008
[7]不确定非线性系统的自适应迭代学习控制研究[D]. 刘萍.南京理工大学 2007
[8]不确定系统的神经网络控制研究[D]. 高宏宇.大庆石油学院 2006
[9]感应电机无速度传感器矢量控制系统的研究[D]. 李自成.华中科技大学 2005
本文编号:3036994
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
三自由度直升机
RBF 神经网络的使用。图 2-3 RBF 神经网络的拓扑结构图 2-3 为径向基函数神经网络(RBFNN)的拓扑结构图,为区别于前文的单个神经网络模型,这里1[ ,..., ]TqZ z z是神经网络输入向量,1[ ,..., ]T llW w w R是输入维数; 1( ) [ ,..., ( )]T llS Z s Z s Z R是基函数向量, l 1是权向量,其中q为节点数。结合前文对神经网络的介绍,使用图中标号可以得到( ) ( )TNNf Z W S Z(2-6)RBF 中的 is Z 一般为 Gauss 函数: 2( )exp , 1, 2,...,Ti iiiZ Zs Z i l (2-7)这里1 2[ , ,..., ]Ti i i iq 表示 Gauss 函数的中心向量,i 表示 Gauss 函数的宽度。可以证明
倾斜方向仿真跟随输出
【参考文献】:
期刊论文
[1]一种基于深度强化学习的自适应巡航控制算法[J]. 韩向敏,鲍泓,梁军,潘峰,玄祖兴. 计算机工程. 2018(07)
[2]基于深度强化学习的水下机器人最优轨迹控制[J]. 马琼雄,余润笙,石振宇,黄晁星,李腾龙. 华南师范大学学报(自然科学版). 2018(01)
[3]液压伺服位置系统的神经网络backstepping控制[J]. 方一鸣,李叶红,石胜利,李建雄. 电机与控制学报. 2014(06)
[4]基于迭代学习的BP神经网络权值训练算法[J]. 周小勇,翟春艳,李书臣,苏成利. 辽宁石油化工大学学报. 2013(04)
[5]基于混合型鲁棒输入训练神经网络的非线性数据校正方法及其应用[J]. 任少君,司风琪,李欢欢,徐治皋. 东南大学学报(自然科学版). 2013(02)
[6]基于小波神经网络自适应反推的永磁同步电机位置伺服控制[J]. 刘达,李木国. 电力自动化设备. 2013(02)
[7]基于双闭环的液压伺服系统控制[J]. 于建均,陈千平,孙亮,李建更,阮晓钢. 北京工业大学学报. 2007(03)
[8]BP网络的改进研究[J]. 远祯,罗波. 信息技术. 2006(02)
博士论文
[1]连续空间强化学习研究[D]. 张春元.电子科技大学 2016
[2]强化学习及其在机器人系统中的应用研究[D]. 陈学松.广东工业大学 2011
硕士论文
[1]基于深度强化学习的游戏控制算法研究与实现[D]. 颜志鹏.电子科技大学 2018
[2]不确定非线性系统的自适应神经网络跟踪控制[D]. 郑晓龙.渤海大学 2016
[3]面向连续状态的神经网络强化学习研究[D]. 王婷婷.中国矿业大学 2016
[4]对含输入饱和约束和未知信息的非线性系统的研究[D]. 张腾飞.北京交通大学 2016
[5]电液伺服系统的神经网络自整定PID控制策略研究[D]. 韦亚娟.燕山大学 2009
[6]一类非线性时滞系统的自适应控制器设计[D]. 郑健.中国石油大学 2008
[7]不确定非线性系统的自适应迭代学习控制研究[D]. 刘萍.南京理工大学 2007
[8]不确定系统的神经网络控制研究[D]. 高宏宇.大庆石油学院 2006
[9]感应电机无速度传感器矢量控制系统的研究[D]. 李自成.华中科技大学 2005
本文编号:3036994
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/3036994.html