当前位置:主页 > 科技论文 > 软件论文 >

基于视频的人体动作识别关键技术研究

发布时间:2018-10-16 10:41
【摘要】:人体动作识别是当前计算机视觉和模式识别领域的研究热点之一,它在视频检索、智能视频监控、人机交互、人体运动分析以及智能监护等领域中有着广泛的应用前景和巨大的市场需求,因此受到学术界、工业界、商业界以及安全机构等各方面的广泛关注。但是,由于动作样式、拍摄视角、光照、背景等的多样性,以及动作定义本身的模糊性,基于视频的动作识别依然是一个极具挑战性的问题。本文围绕人体动作识别中的关键性问题,分别从底层局部特征提取与描述、动作视频中层表示方法、大规模动作识别处理策略以及跨域动作识别方法等几个方面进行了深入研究,主要工作如下:(1)提出了有效轨迹底层特征提取方法和颜色差异特征描述。相对于传统密集轨迹采样,有效轨迹方法基于轨迹通过区域的运动和视觉显著性对轨迹进行判定,保留真正对动作识别有用的轨迹,节省了特征存储所需空间,提高了特征提取处理速度以及最终的动作识别率。传统的特征描述普遍忽略了颜色信息,颜色差异特征利用视频帧中局部区域与其邻域间的颜色差异作为特征描述,分空间域和时间域分别求取。实验证明,颜色差异特征与已有的形状特征和运动特征具有良好的互补性,结合后能够有效的提升动作识别准确率。(2)提出了一种包含时空信息的非负成分表示方法。传统的视觉词袋(BoVW)表示忽略了视觉单词之间的相关性以及局部特征时空分布信息。本文采用基于图正则化的非负矩阵分解算法,从底层局部特征表示中自动学习出相关视觉单词构成动作基元,将视频中的动作表示成多个动作基元的组合,由此得到中层非负成分表示。同时,利用混合高斯模型统计每个视觉单词所对应的局部特征时空位置分布,并用时空Fisher·向量对分布进行描述。通过在图正则化项中添加时空Fisher向量,将时空分布信息融入非负成分表示之中。实验证明,与BoVW相比,该表示方法可以有效提高动作识别准确率。(3)提出了一种针对大规模动作识别数据库的分层字典学习策略。大规模数据库中不同类别间的差异复杂多样,本文将相似和不相似的类别分开处理。基于类别之间的相似性对所有类别进行聚类,形成两层组织结构:第一层中各组差异较大,采用类特定字典学习,为每组学习一个单独的字典;第二层是各组中较为相近的子类,采用基于Fisher判别的混合字典学习,通过混合字典抑制共有部分,放大子类之间的差别。同时,针对分层字典学习的特点,本文给出了相应的分类方法。在多个大规模数据库上的测试结果表明,相比于不分层字典学习,该方法能有效提高大规模动作识别的准确率。(4)提出了一种基于非负混合字典学习的跨域动作识别方法。利用源域和目标域已标注数据,为每个类别学习一个非负混合字典,其中包含公共字典和域特定字典。公共字典对应的动作样本表示部分是两个域共有的,以此作为桥梁,实现跨域动作识别。为保证源域和目标域中公共字典所对应的编码表示部分的分布相近,在混合字典学习的目标函数中引入了最大均值差异来度量两者分布的相似度,最小化两者之间分布的差异。实验证明,与传统特征表示迁移方法相比,该方法能有效提高跨域动作识别的准确率。
[Abstract]:......
【学位授予单位】:东南大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 袁飞;程韬波;周松斌;肖先文;;基于加速度特征的可拓动作识别方法[J];自动化与信息工程;2009年04期

2 胡雅琴;;动作识别技术及其发展[J];电视技术;2013年S2期

3 倪世宏,史忠科,谢川,王彦鸿;军用战机机动飞行动作识别知识库的建立[J];计算机仿真;2005年04期

4 程祥;;人体动作识别的研究[J];电脑知识与技术;2006年20期

5 黄飞跃;徐光yP;;视角无关的动作识别[J];软件学报;2008年07期

6 徐光yP;曹媛媛;;动作识别与行为理解综述[J];中国图象图形学报;2009年02期

7 黄丽鸿;高智勇;刘海华;;基于脉冲神经网络的人体动作识别[J];现代科学仪器;2012年02期

8 周艳青;王磊;;基于视觉的人体动作识别综述[J];山东轻工业学院学报(自然科学版);2012年01期

9 曹琨;;基于检索表的实时动作识别技术研究[J];中外企业家;2014年05期

10 刘博;安建成;;基于关键姿势的人体动作识别[J];电视技术;2014年05期

相关会议论文 前7条

1 袁飞;程韬波;周松斌;肖先文;;基于加速度特征的可拓动作识别方法[A];广州市仪器仪表学会2009年学术年会论文集[C];2010年

2 黄飞跃;徐光yP;;自然的人体动作识别[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年

3 叶喜勇;陶霖密;王国建;邸慧军;;视角无关的人体躯干动作识别[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

4 黄艳欢;叶少珍;;连续动作分割综述[A];第十四届全国图象图形学学术会议论文集[C];2008年

5 董力赓;陶霖密;徐光yP;;头部姿态和动作的识别与理解[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年

6 朱岩;赵旭;刘允才;;基于稀疏编码和局部时空特征的人体动作识别[A];第十五届全国图象图形学学术会议论文集[C];2010年

7 席旭刚;金燕;朱海港;高云园;;基于小波包熵和支持向量机的手部肌电信号动作识别[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年

相关重要报纸文章 前2条

1 本报记者 陈丹;人与机器的“对话”[N];科技日报;2010年

2 ;凌空敲键盘?无线计算机手套问世[N];中国计算机报;2004年

相关博士学位论文 前10条

1 谌先敢;现实环境下的人体动作识别[D];武汉大学;2012年

2 陈渊博;视频序列中的人体动作识别[D];北京邮电大学;2015年

3 刘翠微;视频中人的动作分析与理解[D];北京理工大学;2015年

4 陈萌;基于李代数高斯表示的动作识别方法研究[D];华中科技大学;2016年

5 李拟s,

本文编号:2274101


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2274101.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户07eaf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com