基于光流导向特征的行为识别算法研究
发布时间:2022-01-09 12:33
行为识别是人工智能以及计算机视觉领域中一个重要的研究课题。在日常生活和工作中,具有行为识别能力的智能设备在视频检索、视频监控、人机交互等场景中发挥着重要作用。现有的行为识别算法普遍存在运行速度缓慢的问题,在实际应用中不能达到满意的实时效果。针对此问题本文提出了基于光流导向特征的行为识别算法,主要工作如下:针对提取光流特征的速度缓慢,很难达到满意实时效果的问题,本文使用光流导向特征(Optical Flow guided Feature,OFF)作为表征运动信息的介质提出了OFF特征差分提取算法。该算法首先使用Sobel算子提取空间特征,然后通过差分运算获得视频帧之间的时序信息,最后将空间特征和时间特征进行融合得到所需要的OFF特征。本文利用稀疏采样策略和提出的算法构建了基于OFF特征差分提取算法的行为识别网络(Action Recognition Network based on differential extraction algorithm,即ARNDEA网络)。通过实验对该网络中的OFF特征子网络的位置、学习参数以及迭代次数进行了优化,并探究了网络中空间特征和时间特征的融合方式...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
行为识别算法的应用场景
电子科技大学硕士学位论文18情或者加强前后时间的事物联系。如图2-8所示,对于给出的一个时间的两个序列图片,人们可以很容易的可以分辨它的先后顺序并且推理出在这两个图片所展示的内容之间发生的动作。行为识别中时间推理显得极其重要,它对行为类别的推断提供很多帮助。比如短跑这个单一的动作既包含跑道开始时的助跑、跑道中的奔驰以及最后终点撞线的长时间序列信息,也存在着手臂挥动的短时间序列信息,正确地分清这两个时间序列对于行为的识别是非常有帮助的,视频中的行为识别更是我们需要研究和探索的要点。自从深度学习成为研究热点以来,人们几乎都很重视对视频动作的时间信息的研究。图2-734层卷积网络模块循环卷积神经网络(RecurrentNeurralNework,RNN)是一种专门用来处理时间依赖关系的网络,但是由于梯度消失问题只有短期记忆的功能,它不能顺利使用时间较远的一些信息,而这些信息在某些时候又是非常重要的。Hochreiter等[38]于
第二章行为识别相关基础和理论191997年提出了LSTM模型,该模型通过门控制将短期记忆和长期记忆结合起来,从一定程度上解决了梯度消失问题,成为了解决像行为识别等需要处理时序信息的任务的重要方法。图2-8时间关系推理所有的RNN网络都有重复神经网络的链式的形式,如图2-9为标准的RNN网络图,它的重复模块非常简单,用tanh层来实现;而LSTM除了h在随时间流动外,细胞状态也在不断改变,这就表示了长期记忆,如图2-10所示。XtHtTanhXt-1Ht-1AXt+1Ht+1A图2-9标准RNN网络XtHtTanhXt-1Ht-1AXt+1Ht+1Aδδδxx+图2-10LSTM网络
【参考文献】:
期刊论文
[1]家庭智能空间下基于场景的人的行为理解[J]. 田国会,吉艳青,李晓磊. 智能系统学报. 2010(01)
本文编号:3578729
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
行为识别算法的应用场景
电子科技大学硕士学位论文18情或者加强前后时间的事物联系。如图2-8所示,对于给出的一个时间的两个序列图片,人们可以很容易的可以分辨它的先后顺序并且推理出在这两个图片所展示的内容之间发生的动作。行为识别中时间推理显得极其重要,它对行为类别的推断提供很多帮助。比如短跑这个单一的动作既包含跑道开始时的助跑、跑道中的奔驰以及最后终点撞线的长时间序列信息,也存在着手臂挥动的短时间序列信息,正确地分清这两个时间序列对于行为的识别是非常有帮助的,视频中的行为识别更是我们需要研究和探索的要点。自从深度学习成为研究热点以来,人们几乎都很重视对视频动作的时间信息的研究。图2-734层卷积网络模块循环卷积神经网络(RecurrentNeurralNework,RNN)是一种专门用来处理时间依赖关系的网络,但是由于梯度消失问题只有短期记忆的功能,它不能顺利使用时间较远的一些信息,而这些信息在某些时候又是非常重要的。Hochreiter等[38]于
第二章行为识别相关基础和理论191997年提出了LSTM模型,该模型通过门控制将短期记忆和长期记忆结合起来,从一定程度上解决了梯度消失问题,成为了解决像行为识别等需要处理时序信息的任务的重要方法。图2-8时间关系推理所有的RNN网络都有重复神经网络的链式的形式,如图2-9为标准的RNN网络图,它的重复模块非常简单,用tanh层来实现;而LSTM除了h在随时间流动外,细胞状态也在不断改变,这就表示了长期记忆,如图2-10所示。XtHtTanhXt-1Ht-1AXt+1Ht+1A图2-9标准RNN网络XtHtTanhXt-1Ht-1AXt+1Ht+1Aδδδxx+图2-10LSTM网络
【参考文献】:
期刊论文
[1]家庭智能空间下基于场景的人的行为理解[J]. 田国会,吉艳青,李晓磊. 智能系统学报. 2010(01)
本文编号:3578729
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3578729.html