车载场景下基于深度学习的手势识别研究

发布时间:2022-01-21 20:18
  手势识别是人-机交互领域的关键技术之一,其简单、自然的特点深受研究人员的青睐,从交互角度而言,分为静态手势识别和动态手势识别。近些年来汽车逐渐成为人们的代步工具,行车过程中难免有操作车载多媒体的需求,如打开音乐播放器、增大播放器音量等,此时驾驶员视线将偏离正常的行车路线,从而大大增加了交通事故发生的风险。若能将手势识别技术应用于人车交互领域,将会有效地解决这个问题,因而意义非凡。传统手势识别算法和近些年的手势识别算法基本上是在背景固定、光照不变及采集数据时相对稳定的条件下进行,并不适用于实际车载场景。因此本文提出了车载场景下基于深度学习的手势识别研究方法,其中深度神经网络可以自动提取适合分类的手势特征,残差网络在训练网络模型时可以有效地避免梯度消失;并对所提车载场景下基于关键点的深度残差全连接网络进行了识别性能和鲁棒性的实验。具体研究内容如下:(1)对已有的手势识别研究方法进行了调研,介绍了两大类手势识别方法:基于可穿戴设备的接触式方法和基于计算机视觉的非接触式方法。接触式方法中介绍了利用数据手套进行手势识别;非接触式中介绍了传统的基于摄像头的识别方法和基于深度学习的手势识别研究方法。... 

【文章来源】:安徽大学安徽省 211工程院校

【文章页数】:81 页

【学位级别】:硕士

【部分图文】:

车载场景下基于深度学习的手势识别研究


生物神经元Fig2.2TheStructureofbiologicalneurons

曲线,激活函数,曲线,函数


安徽大学硕士学位论文9神经网络中加入激活函数,则可以逼近所有的非线性函数,复杂的非线性问题也可以得到解决。如今激活函数种类繁多,常见的有sigmoid函数、tanh函数、softmax函数、relu函数以及由relu变形的prelu函数、lrelu函数等。以下简要介绍其中的几种函数,最早的被研究人员所使用的激活函数是sigmoid函数,由于sigmoid函数的特性输出范围是(0,1),见图2.5,机器学习领域中处理的很多问题又为概率问题,所以sigmoid函数早期常被用做首选的激活函数。sigmoid激活函数常用在二分类的任务中,多分类中使用此激活函数不合适,其优点使用简单,缺点是当输出值较大或较小时,网络参数很难更新,容易产生梯度弥散、计算时相对耗时,具有软饱和性,sigmoid函数的表达式如公式(2.4),x为输入,下同。1sigmoid()1xxe(2.4)tanh激活函数是sigmoid的向下平移和伸缩,从图2.4中sigmoid与tanh激活函数曲线可以看出,tanh激活函数经过原点,其值域为(-1,1),tanh激活函数中心化数据时的平均值更接近0,使用sigmoid时接近0.5。研究结果表明,当tanh激活函数作用在隐藏层时,其效果总是优于隐藏层上使用sigmoid激活函数的效果。但当x的值较大或较小时,导数的梯度或者函数的斜率将会越来越趋近于零,梯度下降速度变慢。tanh激活函数的数学表达式如公式(2.5)所示:tanh()xxxxeexee(2.5)图2.4激活函数sigmoid和tanh的曲线Fig2.4Thecurveofactivationfunctionssigmoidandtanh

曲线,激活函数,曲线,反向传播算法


安徽大学硕士学位论文11图2.5激活函数relu和prelu的曲线Fig2.5Thecurvesofactivationfunctionsreluandprelu2.1.2反向传播算法多层人工神经网络比较常用的一种学习算法即反向传播算法,主要用到了梯度下降方法。梯度下降通常适用于可以求解得到误差的情况,如逻辑回归问题,可将此问题映射的网络为没有隐藏层的网络,但一般情况下为了解决问题,我们设计的人工神经网络是包含多个隐藏层,输出层直接求出误差更新网络参数,隐藏层的误差未计算,直接应该梯度下降则是不可行的,因此需要先将误差反向传递给隐藏层后再进项梯度下降,这也是反向传播算法的核心思想。激励传播和权重更新反复循环迭代是反向传播算法的主要步骤,主要分为正向传播和反向传播过程,正向传播时时,期望输出的值与输出层得到的值进行比对,若二者的误差在可接受范围内则输入;若该值与期望输出的值之间的误差不在可接受范围之内,则将二者误差的平方和作为目标函数,进行反向传播,逐层计算目标函数对神经元权值的偏导数,构造目标函数对权值向量的梯量,权值进行相应的修改,直到二者之间的误差达到可接受范围内,整个网络学习结束。反向传播算法流程图如图2.6所示:

【参考文献】:
期刊论文
[1]基于Kinect的动态手势识别[J]. 王兵,董洪伟,张明敏,潘志庚.  传感器与微系统. 2018(02)
[2]基于改进激活函数的卷积神经网络研究[J]. 曲之琳,胡晓飞.  计算机技术与发展. 2017(12)
[3]基于Kinect深度图像的指尖检测与手势识别[J]. 高晨,张亚军.  计算机系统应用. 2017(04)
[4]复杂背景下的手势识别方法[J]. 易靖国,程江华,库锡树.  数字技术与应用. 2016(09)
[5]复杂背景下的手势识别算法研究[J]. 丁毅,曹江涛,李平,姬晓飞.  自动化技术与应用. 2016(08)
[6]深度学习应用技术研究[J]. 毛勇华,桂小林,李前,贺兴时.  计算机应用研究. 2016(11)
[7]基于Dropout深度网络的两步图像标注算法[J]. 杨阳,张文生,杨雪冰.  计算机科学与探索. 2015(12)
[8]基于几何特征的手势识别方法[J]. 林水强,吴亚东,陈永辉.  计算机工程与设计. 2014(02)
[9]基于多点触摸的自然手势识别方法研究[J]. 凌云翔,张国华,李锐,叶挺.  国防科技大学学报. 2010(01)
[10]基于遗传算法和梯度下降的RBF神经网络组合训练方法[J]. 姜鹏飞,蔡之华.  计算机应用. 2007(02)

硕士论文
[1]轮廓曲线的形状描述与匹配算法研究[D]. 刘秀朋.南昌航空大学 2012
[2]基于几何特征的手势识别算法研究[D]. 何阳清.上海海事大学 2004
[3]Hausdorff距离在手势识别中的运用[D]. 苏九林.上海海事大学 2004



本文编号:3600893

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3600893.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a9a3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com