当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的视频分析系统

发布时间:2018-09-07 12:18
【摘要】:每分钟都要海量的视频通过互联网共享出去,著名视频分享网站youtube每分钟上传视频的总时长达100+小时,所以很有必要对这些视频分类检索方便用户选择兴趣内容以应对多媒体信息大爆炸。并且合理的分析理解这些视频对于网站对于提高网站流量,网站业务分析都有很大的作用。本文通过将深度学习与视频分析技术相结合,提出了一种基于深度学习的视频分析系统。该系统使用深度学习中的C3D网络和CNN网络来提取出背景特征和行为特征,然后将提取出来的特征通过多层LSTM网络,经过一系列的加权操作,将背景特征与行为特征依据加权后的可能性组合成描述以完成视频的描述分析工作。为了高效准确的识别出视频中出现的背景和动作特征,本文提出了一种基于CNN模型的改进模型架构——C3D模型。相对于传统CNN模型,C3D模型对CNN中的卷积(convolution)操作和池化(pooling)操作进行改良,即针对视频的时序特征在原有与空间序列关联的基础上添加了时序特性,即3d convolution操作和3d pooling操作,使得能够提取和保持更多的特征,提高背景识别和动作行为识别的准确度。为了将提取出来的特征有效合理的组成有效描述,本文提出了一种基于LSTM模型的多层LSTM模型。C3D顶层所提取出来特征趋向于关注于全局视觉感知视野,而那些底层所提取的特征更加关注于精细、局部的特征,一个有效准确的描述不应该只关注于顶层的宏观特征,而是应该结合底层细节特征共同对于视频内容进行描述。对此我们提出了多层LSTM模型同时提取底层特征和顶层特征来更加准确的描述视频的内容。最后本文陈述了具体的基于深度学习的视频分析系统的主要功能模块的实现和实验数据结果。通过对这些结果分析,系统满足实际需求,具有较强的工程价值和实用价值。
[Abstract]:Every minute a huge amount of video is shared through the Internet. YouTube, a famous video sharing website, uploads video up to 100 + hours per minute. Therefore, it is necessary to classify and retrieve these videos so that users can choose the content they are interested in to cope with the explosion of multimedia information. This paper proposes a video analysis system based on in-depth learning by combining in-depth learning with video analysis technology. The system uses C3D network and CNN network in-depth learning to extract background features and behavior features, and then extracts the features. Through a series of weighted operations, background features and behavior features are combined into descriptions according to weighted possibilities to perform video description and analysis. In order to identify background and action features efficiently and accurately, an improved model architecture based on CNN model, C3D, is proposed in this paper. Comparing with the traditional CNN model, C3D model improves the convolution and pooling operations in CNN, that is, adds the temporal characteristics to the video sequence based on the original spatial sequence association, that is, 3D convolution operation and 3D pooling operation, so that more features can be extracted and maintained. In order to describe the extracted features effectively and reasonably, a multi-layer LSTM model based on the LSTM model is proposed. The features extracted from the top layer of C3D tend to focus on the global visual perception vision, while those extracted from the bottom layer focus more on the fine. Local features, an effective and accurate description should not only focus on the top-level macro-features, but should be combined with the bottom-level details of the video content description. We propose a multi-level LSTM model to extract both the bottom-level features and top-level features to describe the video content more accurately. Through the analysis of these results, the system meets the actual needs and has strong engineering value and practical value.
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP18

【相似文献】

相关期刊论文 前10条

1 刘俊晓;孟祥增;吴鹏飞;;基于内容的视频分析与检索技术及其教学应用[J];中国电化教育;2006年04期

2 邹北骥;杨明;李灵芝;陈姝;韩立芹;;跳水运动视频分析系统设计与实现[J];计算机工程与科学;2007年12期

3 Alan Lipton;刘辰;;关于视频分析的五个常见误解[J];中国安防;2008年09期

4 李玉峰;熊建文;杨友源;;视频分析软件在物理实验中的应用[J];实验室研究与探索;2009年04期

5 刘云;刘雪英;黄超;;基于动态贝叶斯网络的体育视频分析[J];微计算机信息;2010年21期

6 刘文慧;张永强;杨自春;;视频分析在油井运行监测中的应用[J];数字技术与应用;2010年09期

7 张春杰;刘宁;邱怀骏;;视频分析技术及其在地铁中的应用[J];信息与电脑(理论版);2010年10期

8 肖坦;张涛;杨栩;;视频分析功能设计方案及实施[J];铁路技术创新;2010年02期

9 李婷;;视频分析软件:概述、比较与应用[J];中国现代教育装备;2013年11期

10 叶孔仪;视频分析仪[J];现代电视技术;1994年03期

相关会议论文 前1条

1 王仝杰;;互联网热点视频分析方法研究[A];中国新闻技术工作者联合会第六次会员代表大会、2014年学术年会暨第七届《王选新闻科学技术奖》和优秀论文奖颁奖大会论文集(三等奖)[C];2014年

相关重要报纸文章 前8条

1 童剑军;视频分析技术潜力无限[N];计算机世界;2008年

2 安阳;视频分析技术解决安防监控难题[N];中国城乡金融报;2010年

3 本报通讯员 吴苡婷 本报记者 王春;上海工程技术大学研发成功高速人脸视频分析仪[N];科技日报;2013年

4 闫德海 徐少磊;莱阳:六成案件借助视频分析研判破获[N];人民公安报;2014年

5 甘勃邋闫松;虚拟运动员怎样领衔奥运训练[N];大众科技报;2008年

6 赵雪;我多项运动使用数字视频技术[N];科技日报;2008年

7 本报记者 刘瑾;用科技保城市平安[N];经济日报;2012年

8 本报记者 李映;新兴应用助DSP收复“失地”[N];中国电子报;2012年

相关博士学位论文 前4条

1 杨雪锋;基于船载红外视频分析的海盗船艇智能辨识方法研究[D];大连海事大学;2016年

2 汤林勰;多媒体广告计算[D];中国科学技术大学;2011年

3 罗雅琴;视频监控分析云的高可用性研究[D];华中科技大学;2013年

4 高赞;基于内容的视频分析关键技术[D];北京邮电大学;2011年

相关硕士学位论文 前10条

1 张磊(Chenug Ray);基于深度学习的视频分析系统[D];南京邮电大学;2017年

2 凌少虎;面向视频分析的任务管理与执行系统[D];华南理工大学;2015年

3 刘秋燕;基于视频分析的自动报靶系统设计[D];浙江大学;2015年

4 蔡淞;基于视频分析的会场管理系统设计与实现[D];复旦大学;2013年

5 杨波;基于DM8127的高清视频分析平台的设计与实现[D];电子科技大学;2015年

6 张啸林;基于TLD和SIFT的视频分析系统设计与实现[D];西安电子科技大学;2014年

7 徐钲;虚拟卡口平台的设计与实现[D];武汉邮电科学研究院;2014年

8 魏小东;多项目管理方法在视频分析技术企业中的应用研究[D];浙江工业大学;2014年

9 王业成;潜意识暗示下手绘过程中顿悟的研究及原型系统设计[D];浙江理工大学;2016年

10 胡乐;基于视频分析的多模式自动报靶系统设计[D];浙江大学;2016年



本文编号:2228243

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2228243.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户97881***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com