基于特征编码与池化的动作识别方法研究
发布时间:2024-12-26 23:12
随着移动通讯技术的发展,视频数据在互联网上正占有越来越大的比重,我们的生活娱乐也逐渐离不开各种视频应用。智能视频分析技术在智能监控、自动驾驶、鉴黄鉴恐等多个领域有重要的应用价值。动作识别任务作为视频分析领域的核心任务,对它的研究不仅能够提升动作识别效果,而且能够为其它视频相关任务提供理论基础。特征表达是视觉领域的核心问题,而特征编码与池化在特征表达的研究中处于重要地位。特征编码是对输入特征进行编码而得到更高层特征的过程,特征池化是指将空间或时间上特定区域内的视觉特征进行聚合的过程。这两个操作都是在已有局部冗余特征的基础上,通过特定的统计方法来得到更有表达能力的整体紧凑特征。本文针对基于特征编码与池化的动作识别方法进行研究,其中在特征编码方面开展了两项工作:基于局部聚合思想对光流等底层特征进行编码;设计注意力编码层对空域特征进行编码。在特征池化方面也开展了两项研究:运用轨迹先验对视频卷积特征进行时域池化;设计时空门控金字塔池化层对视频卷积特征进行时空域池化。本文的研究内容和主要贡献分为以下四个方面:(1)将局部聚合思想应用到手工设计特征中,提出了基于局部聚合直方图编码描述子的动作识别方法。...
【文章页数】:125 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状及分析
1.2.1 所研究课题的定义
1.2.2 动作识别
1.2.3 特征编码与特征池化
1.2.4 具有代表性的动作识别数据集
1.2.5 现有方法存在的主要问题及可能的解决方案
1.3 本文主要研究内容及组织结构
第2章 基于局部聚合直方图编码描述子的动作识别方法
2.1 引言
2.2 相关工作
2.3 局部聚合直方图编码描述子
2.3.1 基于LA-HOF和LA-MBH描述子的动作识别
2.3.2 基于LA-HOG描述子的目标识别
2.3.3 对所提出描述子的讨论
2.4 实验结果及分析
2.4.1 基于LA-HOF和LA-MBH描述子的动作识别
2.4.2 基于LA-HOG描述子的目标识别
2.5 本章小结
第3章 基于双流卷积注意力编码网络的动作识别方法
3.1 引言
3.2 相关工作
3.3 双流卷积注意力编码网络
3.3.1 基于BN-Inception模型和时域分割思想的特征图提取
3.3.2 注意力编码层
3.3.3 双流特征融合
3.4 实验结果及分析
3.4.1 数据集
3.4.2 实现细节
3.4.3 探索性实验
3.4.4 与现有方法的比较
3.5 本章小结
第4章 基于多尺度轨迹池化三维卷积描述子的动作识别方法
4.1 引言
4.2 相关工作
4.3 多尺度轨迹池化三维卷积描述子
4.3.1 改进轨迹的计算
4.3.2 卷积特征图的提取
4.3.3 特征图归一化和轨迹池化操作
4.3.4 多尺度扩展
4.4 实验结果及分析
4.4.1 数据集和实现细节
4.4.2 探索性实验
4.4.3 与现有方法的比较
4.4.4 错误分析
4.4.5 对实验结果的讨论
4.5 本章小结
第5章 基于时空门控金字塔池化网络的动作识别方法
5.1 引言
5.2 相关工作
5.3 时空门控金字塔池化网络
5.3.1 R(2+1)D网络
5.3.2 时空金字塔池化方法
5.3.3 特征门控机制
5.4 实验结果及分析
5.4.1 数据集和实现细节
5.4.2 探索性实验
5.4.3 与现有方法的比较
5.4.4 定性结果展示
5.5 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其他成果
致谢
个人简历
本文编号:4020769
【文章页数】:125 页
【学位级别】:博士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究现状及分析
1.2.1 所研究课题的定义
1.2.2 动作识别
1.2.3 特征编码与特征池化
1.2.4 具有代表性的动作识别数据集
1.2.5 现有方法存在的主要问题及可能的解决方案
1.3 本文主要研究内容及组织结构
第2章 基于局部聚合直方图编码描述子的动作识别方法
2.1 引言
2.2 相关工作
2.3 局部聚合直方图编码描述子
2.3.1 基于LA-HOF和LA-MBH描述子的动作识别
2.3.2 基于LA-HOG描述子的目标识别
2.3.3 对所提出描述子的讨论
2.4 实验结果及分析
2.4.1 基于LA-HOF和LA-MBH描述子的动作识别
2.4.2 基于LA-HOG描述子的目标识别
2.5 本章小结
第3章 基于双流卷积注意力编码网络的动作识别方法
3.1 引言
3.2 相关工作
3.3 双流卷积注意力编码网络
3.3.1 基于BN-Inception模型和时域分割思想的特征图提取
3.3.2 注意力编码层
3.3.3 双流特征融合
3.4 实验结果及分析
3.4.1 数据集
3.4.2 实现细节
3.4.3 探索性实验
3.4.4 与现有方法的比较
3.5 本章小结
第4章 基于多尺度轨迹池化三维卷积描述子的动作识别方法
4.1 引言
4.2 相关工作
4.3 多尺度轨迹池化三维卷积描述子
4.3.1 改进轨迹的计算
4.3.2 卷积特征图的提取
4.3.3 特征图归一化和轨迹池化操作
4.3.4 多尺度扩展
4.4 实验结果及分析
4.4.1 数据集和实现细节
4.4.2 探索性实验
4.4.3 与现有方法的比较
4.4.4 错误分析
4.4.5 对实验结果的讨论
4.5 本章小结
第5章 基于时空门控金字塔池化网络的动作识别方法
5.1 引言
5.2 相关工作
5.3 时空门控金字塔池化网络
5.3.1 R(2+1)D网络
5.3.2 时空金字塔池化方法
5.3.3 特征门控机制
5.4 实验结果及分析
5.4.1 数据集和实现细节
5.4.2 探索性实验
5.4.3 与现有方法的比较
5.4.4 定性结果展示
5.5 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其他成果
致谢
个人简历
本文编号:4020769
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4020769.html
最近更新
教材专著