基于卷积神经网络的手势识别技术研究

发布时间:2022-02-10 18:52
  伴随机器人技术的快速发展,人类与机器之间的交互更加频繁,人们对人机交互提出新的要求。传统基于鼠标键盘的交互方式需要人去适应机器,友好性、易用性不足,效率较低。技术的发展为人机交互方式提供了更多的选择,其中基于视觉的手势交互符合人类交互习惯,更加高效、自然、友好,其关键是手势识别技术。本文围绕基于深度学习的手势识别技术开展以下研究工作:1.针对人机交互场景的手势数据集的设计与制作。分析手势数据集与模型的识别准确率和鲁棒性的关系,设计并制作手势数据集,为后续深度卷积网络的训练和测试提供支持。2.深度卷积网络参数选择与模块设计。论文首先指出将卷积网络应用于手势识别的可行性与优越性,然后分析卷积核尺寸等关键参数对参数量、计算量、收敛速度及特征点感受野的影响;针对使用随机初始化参数训练网络收敛速度慢、数据需求量大等问题,论文使用迁移学习的方法设定初始参数;针对伴随网络加深出现的网络难以训练等问题,论文引入残差网络结构。3.深度卷积网络结构设计。论文分析了卷积层、池化层、批归一化操作的特点,讨论了网络结构与相应场景识别能力的关系。针对深度卷积网络速度与准确率之间的矛盾,本文使用特征重标定的方法,增... 

【文章来源】:北京化工大学北京市211工程院校教育部直属院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于卷积神经网络的手势识别技术研究


图1-2手势识别示意图??Fig.?1-2?Gesture?recognition?diagram??1.2.2深度学习研究现状??

二维图像,相机,数据手套,手势


?第二章手势识别的相关技术研宄???第二章手势识别的相关理论基础??本章主要介绍了图像识别和深度学习的发展历程及理论基矗图像识别技术是以??图像特征为基础实现对不同目标图像的分类和识别的技术。深度学习通过组合低层特??征形成更加抽象的高层特征,以发现数据的分布式特征表示[27]。其具有强大的非线性??学习能力,可用于提取手势图像的复杂特征进而实现手势图像的分类。本章对与手势??识别研宄相关度较高的图像识别和深度学习相关理论进行回顾与分析,作为改进现有??识别算法的依据。??2.1手势捕捉设备选择??手势数据捕捉是手势识别的前提,手势捕捉设备的类别由手势采集方案决定,而??手势捕捉设备则决定采集到的手势信息种类。目前数据采集方案主要使用以下几种手??势数据捕捉设备:??(1)数据手套??数据手套是用于手势信息采集的专用设备,如图2-1所示,其内部设有弯曲传感??器,可高精度的收集佩戴者手指位置、移动方向、弯曲角度等各类数据。与图像传感??器相比,数据手套采集的数据特征更容易提取,手势识别更为简单。然而数据手套硬??件成本高昂,与之配套的数据处理软件同样需要不菲的成本,而且数据手套限制了穿??戴者手部活动,给穿戴者造成不便。昂贵的价格和操作不便阻碍了数据手套在手势识??别上的应用。??图2-1数据手套示意图??Fig.?2-1?Data?glove?schematic??(2)深度相机??深度相机可以收集二维图像信息并提供图像中物体的深度信息t28],从深度相机得??到的信息中可以得到场景的三维表示,其工作原理分为RGB双目摄像头、飞行时间??7??

双目,摄像头,红外光,成像


?北京化工大学硕士学位论文???测距、结构光三种。??RGB双目摄像头的方案根据图像特征点匹配,由三角测距间接计算出深度信息,??近距离测量精度可达毫米级别,基线为l〇mm时,测量范围在2m以内。该方案成本??较低,然而受光照变化和物体纹理影响较大,在夜间无法使用,且深度信息的获取对??后期处理算法要求较高[29]。图2-2为RGB双目摄像头。??iHfiljBp??图2-2双目摄像头??Fig.?2-2?Binocular?camera??飞行时间测距技术主要用于实现三维成像,其根据红外光波发射与接收之间的时??间差或相位差实现物体深度信息的测量,测量精度最高可达厘米级别,一般可在l〇〇m??内实现距离测量。该方案不受光照变化和物体纹理影响,抗干扰性强,但深度图像分??辨率较低,功耗随分辨率指数增长,成本较高[3叱图2-3为飞行时间测距方案采集得??到的图像。??國?I!?1^9??图2-3飞行时间测距方案成像?图2-4结构光方案??Fig.?2-3?Time?of?flight?imaging?Fig.?2-4?Structured?light?scheme??结构光的方案主动投射已知编码的图案以提升特征匹配效果,实现精度的提高,??如图2-4。其近距离测量精度可达0.01-lmm,测量范围在10m以内。主动光源使结构??光方案适用于光照不足、缺乏纹理的场景,且其生成的图像分辨率较高,但其易受反??光影响,难以在户外环境工作t31]。??(3)单目视觉传感器??与数据手套相比,利用单目视觉传感器收集数据是目前更为主流的方案,如图2-??5所示,其采集得到的二维图像建模简单、数据处理量少、实时性高,

【参考文献】:
期刊论文
[1]深度信念网络研究综述[J]. 丁美昆,徐昱琳,蒋财军.  工业控制计算机. 2016(04)
[2]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正.  计算机应用研究. 2012(08)
[3]基于AdaBoost算法和光流匹配的实时手势识别[J]. 王凯,于鸿洋,张萍.  微电子学与计算机. 2012(04)
[4]基于数据手套输入的汉语手指字母的识别[J]. 吴江琴,高文,陈熙霖.  模式识别与人工智能. 1999(01)

硕士论文
[1]卷积神经网络在异型纤维识别中的研究和应用[D]. 孙硕磊.东华大学 2017
[2]基于视觉的手势识别及人机交互研究[D]. 邬大鹏.南京航空航天大学 2010



本文编号:3619351

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3619351.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ffb02***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com