基于深度学习的视频动作识别方法研究
发布时间:2021-04-11 18:45
海量视频数据的快速增长为人们挖掘其中重要感兴趣信息带来了巨大挑战。如何高效地对海量视频数据进行分析和处理,以获取其中有价值的信息成为工业界以及学术界重点关注并研究的问题。视频数据的结构复杂,且数据量巨大,传统的手工标注方式己无法满足目前视频数量的日益增长需求,亟待需要能够通过学习视频特征进行视频自动分类的技术。视频动作识别技术在特征提取过程中受到遮挡、动态背景变化、摄像头抖动以及视角和光照变化等因素的影响而具有很大的挑战性。而视频分类算法能实现自动分析视频所包含的语义信息、理解其内容,对视频进行自动标注、分类和描述,达到与人相当的准确率。因此,大规模视频分类是继图像分类问题解决后下一个急需解决的关键问题。其中,视频分类中的动作识别方法是本文重点关注的内容。本文基于深度学习模型提取视频中的时间和空间信息,围绕着实现高效的动作识别任务,提出了两种动作识别方法。针对目前主流方法大多集中在3D网络研究上,并将RGB和光流图作为网络输入,造成网络计算开销大和耗时长的问题,本文提出仅使用RGB图像作为输入,基于目标检测的低秩三维动作识别方法。首先,本文提出了基于目标检测算法的视频帧预处理方法,避免...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图2-1强化学习结构??Figure2-1?Structure?of?reinforcement?learning??
图2-2?R-CNN网络的目标检测流程??Figure?2-2?Object?detection?flowchart?of?R-CNN??
图2-3目标检测方法框架??Figure?2-3?Object?detection?method?frameworks??
本文编号:3131766
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
图2-1强化学习结构??Figure2-1?Structure?of?reinforcement?learning??
图2-2?R-CNN网络的目标检测流程??Figure?2-2?Object?detection?flowchart?of?R-CNN??
图2-3目标检测方法框架??Figure?2-3?Object?detection?method?frameworks??
本文编号:3131766
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3131766.html