基于关节数据和极限学习机的人体动作识别
1绪论
随着计算机图形学的快速发展,以及对物理学应用的进一步完善,人们制作出越来越多的和人体动作相关的视频数据,对视频分类技术的需求也不断增长。近年来,人体动作的识别在多个领域表现出广阔的应用前景和研宄价值,其中基于关节数据的人体动作识别更是成为计算机视觉领域的研究热点。在计算机视觉领域,人的动作和姿态由于其复杂性和多变性,一直得到重点关注。虽然视频检索和分类技术己经得到广泛应用,但是人体动作的识别问题一直没有得到很好的解决。首先人体骨豁数太多,每个骨豁又有多个自由度,使得人体动作的表现极其复杂,另外人体不同的活动可能有相似的动作,例如投篮和挥手这两个动作,人的主观判断可以轻松地分辨出来,但是如果仅从肢体动作看,现有识别算法可能很难区分,上述问题亟待解决。本文基于两种动作特征提取算法提出了一种新的组合特征,并结合极限学习机及其多种改进的变体,使人体动作的识别效果得到改善。本章后续内容将介绍本文实验使用的数据的两种捕捉技术、人体动作识别的研宄现状、极限学习机的基本思想及文章组织结构。
........
2运动捕捉数据的表示及动作特征的提取
2.1本文使用的数据集
ASF文件定义了运动数据起始帧的基本骨架姿态,每个骨豁段包含该段的绘制信息。ASF文件必须满足在骨架中没有间隔的要求,即每个关节点都必须有数据,另外,每个子节点必须相对其父节点有偏移,直观理解就是不能出现长度为0的骨骼段。因此,相较于其他文件格式,ASF更便于生成新的骨豁段。AMC文件包含了由ASF文件所定义的骨架的运动数据。这些运动数据每隔一段时间进行一次采样,每一顿由一系列线段构成,每个线段代表一个骨赂段。AMC文件首先记录了根节点在世界坐标系中的绝对位置坐标和旋转数据,然后记录其他每个节点相对其父节点的旋转数据,根据关节的实际情况,每个关节有不同的自由度。
2.2两种动作特征提取算法
为解决上述问题,引入了时序分层结构模型,该模型在2D图像中的空间金字塔匹配,该时序分层结构模型如图2.4所示。第一层协方差矩阵计算了整个运动序列,后面的各层在比上一层小一些的窗口上计算,并且分有交叠和无交叠两种情况,图2.4只显示了分两层时的情况。每个协方差矩阵由两个索引来标记,前一个标示了层数,后一个标示了在该层中的位置,例如第一层标记。第1层中的一个协方差矩阵。从一个窗口到下一个窗口的步长可以是整个窗口的长度,也可以是窗口长度的一半,如果是后者,那么各窗口之间就产生了交叠。3基于组合特征和极限学习机的动作识别....13
3.1特征组合......133.2极限学习机和基于投票的极限学习机....13
4基于线性回归的ELM动作识别...22
4.1线性回归及线性回归分类....22
4.2基于线性回归的极限学习机...24
4.3实验及分析.....25
5基于稀疏表示的ELM动作识别....30
5.1基于稀疏表示的分类器......30
5.2基于稀疏表示的极限学习机....32
5.3实验及分析....32
5.4本章小结......35
6基于Dropout学习策略的ELM动作识别
6.1Dropout学习策略简介
一种合理的解释是有性繁殖的优势是在较长时间尺度下,自然选择的尺度并不在独立基因层面,而是多基因的协同表达。一组基因能够和随机的另一组基因完美合作,这使得整个繁殖系统的鲁棒性更强。因为一个基因不可能总是依赖于一大批的匹配基因来表现,所以它必须要做一些对自己有用或者对与其他一小部分基因组合有用的事。根据这个理论,有性繁殖的作用就不仅仅是让新的有用基因传遍整个群体,而且还通过降低复杂的同化来促进这个过程,而这些同化会降低新基因改善个体适应性的机会。类似地,神经网络中的每个隐藏单元在Dropout训练时都要学习和其他随机选择的节点合作。这可以使每个隐藏层节点有更强的鲁棒性,并且促使它独立产生有用特征,而不是依赖于其他隐藏层节点来纠正错误,并且同一隐藏层的节点还是要完成相互不同的工作。6.2Dropout模型描述
人体动作的数据由于记录内容复杂,且记录的数据样本有限,再加上噪声的存在,极易产生过拟合。所以将Dropout学习策略引入到极限学习机中,可以有效防止信号噪声产生的过拟合,以提高动作识别率。基于Dropout学习策略的极限学习机(D-ELM)的基本方法是保留原始极限学习机的输入层和隐藏层算法,在计算输出层权重时采用Dropout策略以提高抗过拟合性。实现方法为每次调参从中间层的输出矩阵中随机抽取若干列构成,釆用Dropout策略随机丢弃掉部分节点数据,采用广义逆方法求得输出层权向量,并以此对前一次调参所得权向量进行更新,更新方法为用新的权向量替换前一次所得权向量的对应元素,达到收敛条件后,形成最终的输出层权向量。........
7总结与展望
7.1论文总结
对比这四项工作,得出如下结论:(1)改进的组合特征描述符在ELM及其各种变体上能HOD得到比原始特征更好的识别效果。(2)当隐藏层节点数为100000时,基于线性回归的ELM在这种情况下识别效果较原始ELM有所降低,基于稀疏表示和基于Dropout学习策略的ELM都可以得到优于原始ELM算法的识别效果,其中基于Dropout策略的ELM得到的识别效果最好。(3)当隐藏层节点数为10000时,基于Dropout的ELM识别率较没有提高,而基于线性回归和基于稀疏表示的ELM较原始ELM均有提高,其中基于线性回归的ELM对特征识别效果更好,基于稀疏表示的ELM对协方差特征和组合特征的识别效果更好。7.2未来工作展望
在后期的工作中,希望可以实现如下目标:(1)对子关节相对父关节的旋转角度提取特征,以实现旋转、缩放、平移和尺度的不变性,来进一步改善分类效果。(2)对于低精度的人体运动捕捉数据,可以首先对运动序列中的各关节点采用球面或样条差值,以这种方式减少噪声,然后再进行后续的特征提取和分类。(3)目前使用ELM对人体动作进行的识别都是建立在大量隐藏层节点的情况下,对实验机器内存的要求非常高,后期工作中,,希望能够找到新的方法减少隐藏层节点的需求量,以提高算法的实用性。(4)将本文中的分类方法应用到更多领域,以验证其普适性。........
参考文献(略)
本文编号:63706
本文链接:https://www.wllwen.com/wenshubaike/lwfw/63706.html