视频人体行为识别中的特征编码
本文关键词:视频人体行为识别中的特征编码,由笔耕文化传播整理发布。
【摘要】:识别视频中的人体行为在计算机视觉领域逐渐引起了广泛的关注,它的目标是自动识别出未知的视频或者图像序列中人的行为。然而,如何有效快速地识别视频中的行为仍然面临诸多挑战,例如杂乱的背景,视角的改变,动作执行者的外观多样性等等。这些挑战导致了获取干净并且有区分能力的视频表示异常困难。近年来,局部描述子聚合向量(VLAD)被提出,这是一种简单同时也很高效的特征编码方法,能够获得区分性较好的视频表示。然而,在很多情况下,动态背景或者摄像机的移动会给视频的特征提取带来很大的噪声,这种编码方式会造成两方面的问题,首先,将异常的视频描述子也编码到视频表示中使得编码速度以及编码效果受影响;其次,没有充分考虑描述子特征与视觉单词的空间分布信息。本文针对视频人体行为识别的特征编码方法进行了研究,主要贡献和创新点如下:1.系统介绍了人体行为识别研究的一般流程,针对流程的每个部分,详细介绍了涉及的理论知识。比较了常用的特征编码方法,分析了各自的优缺点。2.提出了一种改进局部描述子聚合向量的方法,即不确定的局部描述子聚合向量(UVLAD),该方法针对每个描述子特征,充分考虑了噪声以及它与视觉单词的空间分布信息,采用字典里的若干个单词来对它进行编码,或者丢弃它,提升了视频特征编码的性能。3.在KTH,Youtube和HMDB51数据集上的实验,验证了不确定的局部描述子聚合向量的有效性,同时行为识别准确率超过了现有的最好的结果。
【关键词】:特征编码 行为识别 局部描述子聚合向量 描述子特征
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN919.81
【目录】:
- 摘要3-4
- ABSTRACT4-10
- 主要符号对照表10-11
- 第一章 绪论11-21
- 1.1 研究背景11-13
- 1.2 国内外研究现状13-17
- 1.2.1 视频预处理13-14
- 1.2.2 视频特征的提取14
- 1.2.3 特征空间的字典学习和特征编码14-15
- 1.2.4 分类器的设计15-17
- 1.3 面临的困难17-18
- 1.4 本文的研究工作18-21
- 第二章 视频人体行为识别的特征提取21-31
- 2.1 特征的分类21
- 2.2 全局特征21-23
- 2.2.1 基于轮廓的全局特征23
- 2.3 局部特征23-28
- 2.3.1 时空兴趣点的检测23-26
- 2.3.2 时空兴趣点的描述26-28
- 2.4 本章小结28-31
- 第三章 视频人体行为识别的特征编码31-41
- 3.1 特征空间的字典学习31-33
- 3.1.1 K-均值聚类31
- 3.1.2 混合高斯模型31-32
- 3.1.3 随机字典32-33
- 3.2 特征编码33-39
- 3.2.1 基于投票的特征编码33-34
- 3.2.2 基于重构的特征编码34-36
- 3.2.3 基于显著度的特征编码36-38
- 3.2.4 其他类特征编码38-39
- 3.3 本章小结39-41
- 第四章 基于局部描述子聚合向量的改进算法41-51
- 4.1 局部描述子聚合向量的原理41-45
- 4.1.1 原始的局部描述子聚合向量41
- 4.1.2 局部描述子聚合向量的几种改进41-45
- 4.2 不确定的局部描述子聚合向量的原理45-49
- 4.2.1 滤掉异常的描述子特征46
- 4.2.2 不确定的局部描述子聚合向量46-49
- 4.3 本章小结49-51
- 第五章 实验结果与分析51-61
- 5.1 数据集51-52
- 5.2 实验的设置52-54
- 5.2.1 视频描述子特征的选择52-53
- 5.2.2 算法参数的设置53
- 5.2.3 行为识别的评价标准53-54
- 5.3 实验的结果54-58
- 5.3.1 最近邻参数K的影响54
- 5.3.2 参数 β 和 γ 的影响54-55
- 5.3.3 残差聚合策略的影响55-56
- 5.3.4 VLAD和UVLAD的比较56
- 5.3.5 与当前最好结果的比较56-58
- 5.4 本章小结58-61
- 第六章 总结和展望61-63
- 6.1 本文主要工作61-62
- 6.2 未来展望62-63
- 参考文献63-69
- 致谢69-70
- 攻读学位期间发表的学术论文目录70-71
- 攻读学位期间参与的项目71-73
【相似文献】
中国期刊全文数据库 前10条
1 吴磊,吴俊军;基于特征编码的三维可视化圈阅[J];华中科技大学学报;2001年12期
2 黄天羽;李凤霞;战守义;李祥晨;;一种基于几何特征编码的运动搜索[J];系统仿真学报;2006年10期
3 朱月香;TreeView控件的应用[J];兵工自动化;2003年06期
4 皮德常,秦小麟,王宁生;多层分组叠加有限制特征编码[J];小型微型计算机系统;2001年05期
5 张敏,马青,马少平;自组织中文语义映射网络的优化特征编码方法[J];中文信息学报;2003年03期
6 张一楠;高宏;张炜;;基于双分支特征编码的子图查询处理算法[J];计算机研究与发展;2011年S3期
7 张天兵,吴俊军,张新访,钟毅芳,周济;并行工程下产品协调模型的研究[J];计算机辅助设计与图形学学报;2000年10期
8 肖娟;郭美;肖敏;;基于特征编码的指纹识别方法[J];湘南学院学报;2010年02期
9 徐建宁;刘来英;;基于特征编码的拉深件CAPP信息模型[J];金属成形工艺;1997年05期
10 方旺盛;舒明磊;;一种基于特征编码的Word文档数字水印算法[J];科技广场;2006年01期
中国博士学位论文全文数据库 前2条
1 彭小江;基于视频的人体行为分析算法研究[D];西南交通大学;2014年
2 高广谓;基于特征编码和回归分析的指关节纹识别研究[D];南京理工大学;2014年
中国硕士学位论文全文数据库 前5条
1 王先中;视频人体行为识别中的特征编码[D];上海交通大学;2015年
2 薛东彬;超硬材料工具CAD/CAPP集成系统关键技术研究[D];郑州大学;2008年
3 智慧;人类RNA聚合酶Ⅱ启动子识别研究[D];同济大学;2008年
4 贺晨轩;基于多特征编码的泛素化位点预测研究[D];东北师范大学;2015年
5 黄磊;LCD微小瑕疵自动分类[D];上海交通大学;2014年
本文关键词:视频人体行为识别中的特征编码,,由笔耕文化传播整理发布。
本文编号:396513
本文链接:https://www.wllwen.com/kejilunwen/wltx/396513.html