基于深度学习的视频分析系统
[Abstract]:Every minute a huge amount of video is shared through the Internet. YouTube, a famous video sharing website, uploads video up to 100 + hours per minute. Therefore, it is necessary to classify and retrieve these videos so that users can choose the content they are interested in to cope with the explosion of multimedia information. This paper proposes a video analysis system based on in-depth learning by combining in-depth learning with video analysis technology. The system uses C3D network and CNN network in-depth learning to extract background features and behavior features, and then extracts the features. Through a series of weighted operations, background features and behavior features are combined into descriptions according to weighted possibilities to perform video description and analysis. In order to identify background and action features efficiently and accurately, an improved model architecture based on CNN model, C3D, is proposed in this paper. Comparing with the traditional CNN model, C3D model improves the convolution and pooling operations in CNN, that is, adds the temporal characteristics to the video sequence based on the original spatial sequence association, that is, 3D convolution operation and 3D pooling operation, so that more features can be extracted and maintained. In order to describe the extracted features effectively and reasonably, a multi-layer LSTM model based on the LSTM model is proposed. The features extracted from the top layer of C3D tend to focus on the global visual perception vision, while those extracted from the bottom layer focus more on the fine. Local features, an effective and accurate description should not only focus on the top-level macro-features, but should be combined with the bottom-level details of the video content description. We propose a multi-level LSTM model to extract both the bottom-level features and top-level features to describe the video content more accurately. Through the analysis of these results, the system meets the actual needs and has strong engineering value and practical value.
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP18
【相似文献】
相关期刊论文 前10条
1 刘俊晓;孟祥增;吴鹏飞;;基于内容的视频分析与检索技术及其教学应用[J];中国电化教育;2006年04期
2 邹北骥;杨明;李灵芝;陈姝;韩立芹;;跳水运动视频分析系统设计与实现[J];计算机工程与科学;2007年12期
3 Alan Lipton;刘辰;;关于视频分析的五个常见误解[J];中国安防;2008年09期
4 李玉峰;熊建文;杨友源;;视频分析软件在物理实验中的应用[J];实验室研究与探索;2009年04期
5 刘云;刘雪英;黄超;;基于动态贝叶斯网络的体育视频分析[J];微计算机信息;2010年21期
6 刘文慧;张永强;杨自春;;视频分析在油井运行监测中的应用[J];数字技术与应用;2010年09期
7 张春杰;刘宁;邱怀骏;;视频分析技术及其在地铁中的应用[J];信息与电脑(理论版);2010年10期
8 肖坦;张涛;杨栩;;视频分析功能设计方案及实施[J];铁路技术创新;2010年02期
9 李婷;;视频分析软件:概述、比较与应用[J];中国现代教育装备;2013年11期
10 叶孔仪;视频分析仪[J];现代电视技术;1994年03期
相关会议论文 前1条
1 王仝杰;;互联网热点视频分析方法研究[A];中国新闻技术工作者联合会第六次会员代表大会、2014年学术年会暨第七届《王选新闻科学技术奖》和优秀论文奖颁奖大会论文集(三等奖)[C];2014年
相关重要报纸文章 前8条
1 童剑军;视频分析技术潜力无限[N];计算机世界;2008年
2 安阳;视频分析技术解决安防监控难题[N];中国城乡金融报;2010年
3 本报通讯员 吴苡婷 本报记者 王春;上海工程技术大学研发成功高速人脸视频分析仪[N];科技日报;2013年
4 闫德海 徐少磊;莱阳:六成案件借助视频分析研判破获[N];人民公安报;2014年
5 甘勃邋闫松;虚拟运动员怎样领衔奥运训练[N];大众科技报;2008年
6 赵雪;我多项运动使用数字视频技术[N];科技日报;2008年
7 本报记者 刘瑾;用科技保城市平安[N];经济日报;2012年
8 本报记者 李映;新兴应用助DSP收复“失地”[N];中国电子报;2012年
相关博士学位论文 前4条
1 杨雪锋;基于船载红外视频分析的海盗船艇智能辨识方法研究[D];大连海事大学;2016年
2 汤林勰;多媒体广告计算[D];中国科学技术大学;2011年
3 罗雅琴;视频监控分析云的高可用性研究[D];华中科技大学;2013年
4 高赞;基于内容的视频分析关键技术[D];北京邮电大学;2011年
相关硕士学位论文 前10条
1 张磊(Chenug Ray);基于深度学习的视频分析系统[D];南京邮电大学;2017年
2 凌少虎;面向视频分析的任务管理与执行系统[D];华南理工大学;2015年
3 刘秋燕;基于视频分析的自动报靶系统设计[D];浙江大学;2015年
4 蔡淞;基于视频分析的会场管理系统设计与实现[D];复旦大学;2013年
5 杨波;基于DM8127的高清视频分析平台的设计与实现[D];电子科技大学;2015年
6 张啸林;基于TLD和SIFT的视频分析系统设计与实现[D];西安电子科技大学;2014年
7 徐钲;虚拟卡口平台的设计与实现[D];武汉邮电科学研究院;2014年
8 魏小东;多项目管理方法在视频分析技术企业中的应用研究[D];浙江工业大学;2014年
9 王业成;潜意识暗示下手绘过程中顿悟的研究及原型系统设计[D];浙江理工大学;2016年
10 胡乐;基于视频分析的多模式自动报靶系统设计[D];浙江大学;2016年
,本文编号:2228243
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2228243.html