基于骨架信息的人体动作识别
本文选题:人体动作识别 + 人体骨架 ; 参考:《中国科学技术大学》2017年硕士论文
【摘要】:人体动作识别是计算机视觉领域一大热门的研究方向。其主要目的是对视频中的人体动作进行正确地分类。这项技术可以被应用到智能视频监控、人机自然交互、运动视频分析以及无人驾驶等领域。然而如何构造有效的特征来对视频当中的人体动作进行描述一直是一个非常有挑战性的问题。本文通过对人体骨架信息进行深入挖掘,提出了基于关节点位置的动力学和关系特征,这组特征由4大类特征、36种子特征构成。1.关节动力学特征:这一大类特征由速度、加速度、角速度、角加速度、速率、加速率、动能、动能变化、重力势能、重力势能变化、总能量、总能量变化、归一化位置等13种子特征构成,这组特征从关节点运动和能量变化的角度出发,充分地挖掘了人体骨架的动力学信息。2.相关关系特征:这一大类特征由速度相关关系、加速度相关关系、角速度相关关系、角加速度相关关系,能量变化相关关系等5种子特征构成,这组特征描述了任意一对关节点之间的运动相关关系和能量变化相关关系。3.距离关系特征:这一大类特征由水平距离关系及其轨迹、垂直距离关系及其轨迹、方向正弦距离关系及其轨迹、方向余弦距离关系及其轨迹、特征向量方向距离关系及其轨迹、连通距离关系及其轨迹等12种子特征构成,这组特征描述了任意一对关节点在特定方向上的距离关系。4.几何关系特征:这一大类特征由关节向量内积及其轨迹、关节向量余弦相关性及其轨迹、关节三角形面积周长比及其轨迹等6种子特征构成构成,这组特征描述了任意三个关节点之间几何关系。将这些特征合并在一起构成基于关节点位置的动力学和关系特征。本文对这组特征的各个子特征进行了全面的比较。这组特征在JHMDB数据集、sub-JHMDB数据集和Penn Action数据集上均取得了不错的效果。此外,由于动作识别系统中每个环节都会对最后的识别结果产生一定的影响,因此本文探索了适合基于关节点位置的动力学和关系特征的动作识别算法框架。其中最合适的词袋模型为基于K均值聚类和向量量化的词袋模型,最有效的分类模型为多通道的RBF-χ2核的支持向量机。总而言之,通过充分挖掘骨架信息,本文提出了一组基于关节点位置的动力学和相关关系特征,并探索了适合这一特征的词袋模型和分类模型。通过充分的实验验证了这组特征的有效性,也为下一步利用基于骨架信息对人体动作进行识别的研究工作提供了建议。
[Abstract]:Human motion recognition is a hot research direction in the field of computer vision.Its main purpose is to correctly classify human actions in video.This technology can be applied to intelligent video surveillance, human-computer natural interaction, motion video analysis and driverless.However, how to construct effective features to describe human actions in video has been a very challenging problem.In this paper, a dynamic and relational feature based on the location of the gate node is proposed by mining the skeleton information of the human body.Joint dynamics: this broad category of characteristics consists of velocity, acceleration, angular velocity, angular acceleration, rate, acceleration rate, kinetic energy, kinetic energy change, gravity potential energy, gravity potential energy change, total energy, total energy change,The normalized position and other 13 seed features are formed. This set of features fully excavates the dynamic information of the human skeleton from the point of view of the movement and energy change of the node.Correlation characteristics: this kind of feature is composed of five characteristics: velocity correlation, acceleration correlation, angular velocity correlation, angular acceleration correlation, energy variation correlation, etc.This set of features describes the kinematic and energy-dependent relationships between any pair of nodes.The feature of distance relation: this kind of feature consists of horizontal distance relation and its trajectory, vertical distance relation and its trajectory, directional sinusoidal distance relationship and its trajectory, directional cosine distance relationship and its trajectory, characteristic vector directional distance relation and its trajectory.The connected distance relation and its trace are composed of 12 seed features, which describe the distance relation of any pair of nodes in a particular direction.Geometric relation feature: this kind of feature is composed of 6 seed features, such as joint vector inner product and its trajectory, joint vector cosine correlation and its trajectory, joint triangle area / circumference ratio and its trajectory, etc.This set of features describes the geometric relationship between any three nodes.These features are combined to form dynamic and relational features based on the location of the node.This paper makes a comprehensive comparison of each subfeature of this set of features.This set of features has achieved good results on JHMDB data sets sub-JHMDB datasets and Penn Action datasets.In addition, because every link in the motion recognition system will have a certain impact on the final recognition results, this paper explores an action recognition algorithm framework that is suitable for dynamic and relational features based on the location of the node.The most suitable word bag model is based on K-means clustering and vector quantization, and the most effective classification model is multi-channel RBF- 蠂 2 kernel support vector machine.In a word, by fully mining the skeleton information, this paper proposes a set of dynamics and correlation features based on the location of the node, and explores the word bag model and classification model suitable for this feature.The validity of this set of features is verified by experiments, and some suggestions are provided for the further research on the recognition of human actions based on skeleton information.
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 袁飞;程韬波;周松斌;肖先文;;基于加速度特征的可拓动作识别方法[J];自动化与信息工程;2009年04期
2 胡雅琴;;动作识别技术及其发展[J];电视技术;2013年S2期
3 倪世宏,史忠科,谢川,王彦鸿;军用战机机动飞行动作识别知识库的建立[J];计算机仿真;2005年04期
4 程祥;;人体动作识别的研究[J];电脑知识与技术;2006年20期
5 黄飞跃;徐光yP;;视角无关的动作识别[J];软件学报;2008年07期
6 徐光yP;曹媛媛;;动作识别与行为理解综述[J];中国图象图形学报;2009年02期
7 黄丽鸿;高智勇;刘海华;;基于脉冲神经网络的人体动作识别[J];现代科学仪器;2012年02期
8 周艳青;王磊;;基于视觉的人体动作识别综述[J];山东轻工业学院学报(自然科学版);2012年01期
9 曹琨;;基于检索表的实时动作识别技术研究[J];中外企业家;2014年05期
10 刘博;安建成;;基于关键姿势的人体动作识别[J];电视技术;2014年05期
相关会议论文 前7条
1 袁飞;程韬波;周松斌;肖先文;;基于加速度特征的可拓动作识别方法[A];广州市仪器仪表学会2009年学术年会论文集[C];2010年
2 黄飞跃;徐光yP;;自然的人体动作识别[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
3 叶喜勇;陶霖密;王国建;邸慧军;;视角无关的人体躯干动作识别[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
4 黄艳欢;叶少珍;;连续动作分割综述[A];第十四届全国图象图形学学术会议论文集[C];2008年
5 董力赓;陶霖密;徐光yP;;头部姿态和动作的识别与理解[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
6 朱岩;赵旭;刘允才;;基于稀疏编码和局部时空特征的人体动作识别[A];第十五届全国图象图形学学术会议论文集[C];2010年
7 席旭刚;金燕;朱海港;高云园;;基于小波包熵和支持向量机的手部肌电信号动作识别[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年
相关重要报纸文章 前2条
1 本报记者 陈丹;人与机器的“对话”[N];科技日报;2010年
2 ;凌空敲键盘?无线计算机手套问世[N];中国计算机报;2004年
相关博士学位论文 前10条
1 谌先敢;现实环境下的人体动作识别[D];武汉大学;2012年
2 陈渊博;视频序列中的人体动作识别[D];北京邮电大学;2015年
3 刘翠微;视频中人的动作分析与理解[D];北京理工大学;2015年
4 陈萌;基于李代数高斯表示的动作识别方法研究[D];华中科技大学;2016年
5 李拟s,
本文编号:1754428
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1754428.html