当前位置:主页 > 科技论文 > 网络通信论文 >

基于拓扑稀疏编码深度学习的视频语义概念检测方法研究

发布时间:2021-07-30 20:44
  近年来,随着互联网、多媒体技术迅猛发展,网络视频数据传输更加方便、来源愈加多样使网络视频数据量迅速增加。视频数据作为当前互联网中的重要数据源,含有比其它类型数据更加复杂、丰富的信息。如此丰富的视频数据促使人们在语义层面对视频数据进行分析建立视频的语义概念标签以实现对数据的更高效管理和检索。研究如何高效的学习和利用视频数据特征实现视频语义概念建模检测成为视频管理和检索领域的热点问题。本文在查阅大量国内外文献基础上,首先对视频语义概念检测的研究背景、意义及现状进行介绍,然后简明介绍几种深度学习模型以及基于深度学习的视频语义概念检测研究应用。本文分析以往研究中不足之处提出基于拓扑稀疏编码预训练卷积神经网络的视频语义分析、基于图正则化优化深度神经网络的视频语义分析,并且设计实现语义概念检测原型系统。本文主要研究内容如下:(1)提出了基于拓扑稀疏编码预训练卷积神经网络的视频语义分析。针对以往研究中基于卷积神经网络的视频特征学习模型没有考虑对视频图像拓扑信息学习的问题,本文提出基于拓扑稀疏编码预训练卷积神经网络的视频语义分析方法,该方法为稀疏自动编码器引入拓扑约束,构建了一个新的拓扑稀疏编码器用之... 

【文章来源】:江苏大学江苏省

【文章页数】:83 页

【学位级别】:硕士

【部分图文】:

基于拓扑稀疏编码深度学习的视频语义概念检测方法研究


深度学习模型图

结构图,前馈神经网络,函数复合,激活函数


分类器可抽象为将输入 x 映射网络定义 y f( x ; θ )的映射函数,经学习最佳近似。这种模型具有前向传导的特性,程,最终达到输出 。前馈神经网络的隐层单元组成,隐层计算单元的计算首先是对输应用非线性激活函数做非线性映射得到输出于非线性激活函数,这种非线性特性使神经近似任何计算函数[22],并且不会降解为单使用多个不同的函数复合表示,能够与一个地描述函数的复合过程。例如,将三个函数复合函数(3) (2) (1)f ( x ) f ( f ( f ( x)))构成神经.2 为一个简单前馈神经网络结构图。

模型结构,权重,稀疏编码,语义概念


基于拓扑稀疏编码深度学习的视频语义概念检测方法研究表达式如下:2( ) ( ) 211( , ) ( )Ni iiJ x xN W b W数目, { , }e dW W W 为权重参数, { , }e db b b 为偏置输入样本的重构误差,第二项为权重衰减项, 为权重将网络各处设置为输出对等输入 ( ( ))d ex f fx ,网络具有缺陷,研究通常会进一步考虑向自动编码器的目,使自动编码器学习近似地复制重构输出,同时通过持输入数据的特定特性,从而学习获得数据更有意义[26]、压缩自动编码器等[27]等。

【参考文献】:
期刊论文
[1]基于卷积-自动编码机的三维形状特征学习[J]. 谢智歌,王岳青,窦勇,熊岳山.  计算机辅助设计与图形学学报. 2015(11)
[2]数据驱动的图像智能分析和处理综述[J]. 汪淼,张方略,胡事民.  计算机辅助设计与图形学学报. 2015(11)
[3]核可鉴别的特征分块稀疏表示的视频语义分析[J]. 詹永照,田华锋,毛启容.  计算机辅助设计与图形学学报. 2014(08)
[4]深度学习的昨天、今天和明天[J]. 余凯,贾磊,陈雨强,徐伟.  计算机研究与发展. 2013(09)



本文编号:3312097

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3312097.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1c17e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com