当前位置:主页 > 管理论文 > 领导决策论文 >

基于视觉深度预测的水下航行器自主强化控制研究

发布时间:2021-11-13 17:45
  随着人类对海洋开发和认识的逐步深入,视觉水下航行器已成为探索海洋的关键设备,并广泛应用于水下搜救、勘测及海洋生物监测等任务。视觉环境感知作为视觉水下航行器获取、分析和认知所处环境的重要手段,通过处理和反馈视觉信息辅助水下航行器自主控制决策,保障了决策的正确性及水下航行器的安全性。在不同水下任务下环境感知与自主控制决策的实时性存在差异,不匹配的感知和控制方案会造成状态提取与控制决策的异步,无法保障水下航行器自主航行控制的鲁棒性,严重时甚至造成控制系统的失稳导致任务失败。在此背景下,本文以水下航行器为研究对象,以离散视觉(图像)和连续视觉(视频)感知条件下的自主强化控制决策为目标,利用深度学习通过环境数据驱动获取感知特征,利用强化学习通过航行状态驱动获取动作决策,进而满足水下航行器自主感知与分析、决策与控制一体化的自主航行需求,主要研究工作如下:论文在论述了水下航行器及其智能感知与决策算法的发展与研究现状的基础上,阐述了深度强化学习算法的原理。针对离散视觉的水下环境深度预测,设计了一种具备离散深度特征信息提取功能的全卷积残差网络,在编码器—解码器的神经网络架构下,结合残差学习和监督学习,解... 

【文章来源】:大连海事大学辽宁省 211工程院校

【文章页数】:89 页

【学位级别】:硕士

【部分图文】:

基于视觉深度预测的水下航行器自主强化控制研究


图2.2深度神经网络结构图??Fig.?2.2?Structure?of?Deep?Neural?Networks??

卷积,基本模型


连接和权??值共享两大基本特征,下面着重介绍卷积神经网络的基本组成部分,将分别从卷积层、??池化层、激活函数和全连接层四个方面展开阐述。??2.2.1卷积层??卷积神经网络中的每个卷积层(Convolutional?layer)都由若干卷积单元组成,并且??每个卷积单元的参数都通过反向传播算法进行优化的。卷积运算的目的是提取神经网??络输入的相关特征,单层卷积只能提取一些低级特征,例如边缘、线条和角等层级等,??多层卷积可以从低级特征中经不断迭代提取更复杂的特征。通常的卷积层模型如图2.3??所示。??输入??一1— ̄'<4^?5??卷积核?Vi?-U弋h??r?!8r-1-r-r??输出??图2.3卷积层基本模型??Fig.?2.3?Basic?model?of?convolutional?layer??2.2.2池化层??池化层(Pooling?Layer)通常作为卷积层中的第三层次,前面两个层次分别由卷积核??进行卷积操作和由激活函数进行非线性操作,而在池化层中则是对前两层提取的特征??进行再处理。池化层使用某一位置相邻输出的总体统计信息来表示该区域的特征,池??化的目的主要是为了减少特征表观的维度大小,从而降低网络结构的复杂性。总结池??化层的具体作用主要为以下几点:??(1)降低特征尺寸的维度,并减少计算量;??(2)在一定程度缓解了过拟合问题,更方便优化;??(3)使得特征具有位移不变性。无论采用最大池化操作还是平均池化操作,都和特??征的位置没有关系;??-10-??

激活函数,梯度


??此能够适当地提高网络的参数。??2.2.3激活函数??激活函数(Activation?Function)是神经元的重要组成部分。神经网络引入的激活函??数是为了增加神经网络模型的非线性,以便它们可以逼近任何非线性函数,这样神经??网络可以应用于许多非线性模型。下面介绍几种常用的激活函数。??(1)?Sigmoid?函数??Sigmoid函数是一种较早出现的激活函数,把激活值最终投射到0到1的区间上。??Sigmoid激活函数通常可以作为概率解释,通过这种方式加入非线性因素。如图2.4所??示,其数学形式定义为:??办)+?e(-wi+6)'?(2.2)??也可以写成:??z?=?wx?+?b,?,f(z)?=?1?^?(2.3)??■L十6??一?I?丨.丨,??0.4-???h??!?17??0?^?丨?I??-8-6?-4?-2?02468??图2.4?Sigmoid激活函数??Fig.?2.4?Sigmoid?activation?function??在实际应用中,Sigmoid函数因为它的性质引起了两个显著的缺点:??①Sigmoid激活函数输出分布非零点对称。对于神经网络权重的梯度更新来说,若??数据流经过神经元的数据为正,那么在反向传播的权重梯度也将为正(取决于表达式的??梯度),这种情况下造成的梯度并非理想,但是将其加入到整批数据最终更新的权重上??时,相比过饱和激活函数来说结果可以接受;??②Sigmoid激活函数饱和导致的梯度骤减。当Sigmoid激活函数饱和时,函数值非??0即1。在反向传播的过程中,局部梯度会乘以整个网络最终输出的梯度。因此,如果??梯度很

【参考文献】:
期刊论文
[1]国外大型无人水下航行器发展综述[J]. 钟宏伟,李国良,宋林桦,莫春军.  水下无人系统学报. 2018(04)
[2]国外海洋无人航行器的发展现状及趋势[J]. 代威,张雯,张沥,解春雷,惠俊鹏.  兵器装备工程学报. 2018(07)
[3]基于深度强化学习的水下机器人最优轨迹控制[J]. 马琼雄,余润笙,石振宇,黄晁星,李腾龙.  华南师范大学学报(自然科学版). 2018(01)
[4]国外水下无人系统技术发展现状与趋势浅析[J]. 李亮,邹金顺.  舰船科学技术. 2017(23)
[5]无人水下航行器的发展现状与关键技术[J]. 王童豪,彭星光,潘光,徐德民.  宇航总体技术. 2017(04)
[6]深度强化学习综述[J]. 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.  计算机学报. 2018(01)
[7]潜用UUV回收技术[J]. 周杰,周文林.  四川兵工学报. 2011(08)
[8]基于神经网络的自主水下机器人动态反馈控制[J]. 周焕银,刘开周,封锡盛.  电机与控制学报. 2011(07)
[9]基于L2干扰抑制的水下机器人人三三维航迹跟踪控制[J]. 张利军,贾鹤鸣,边信黔,严浙平,程相勤.  控制理论与应用. 2011(05)
[10]水下机器人的神经网络自适应控制[J]. 俞建成,李强,张艾群,王晓辉.  控制理论与应用. 2008(01)



本文编号:3493437

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3493437.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1cced***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com