当前位置:主页 > 科技论文 > 搜索引擎论文 >

近重复视频检测算法研究

发布时间:2018-05-15 20:06

  本文选题:近重复视频检测 + 相似性查询 ; 参考:《复旦大学》2012年博士论文


【摘要】:随着宽带传输网络的日益完善和视频软、硬件处理技术的快速发展和广泛应用,尤其随着WEB2.0技术的快速发展,使得网络视频内容呈爆炸性增长的同时也伴随着产生了大量的近重复视频。大量近重复视频的产生给版权保护、视频内容监管和视频搜索引擎结果排序等多方面带来技术性的挑战。在此背景下,基于内容的近重复视频检测技术应运而生。 本文对目前主要的近重复视频检测技术进行了总结。尽管这些方法有各自的应用场景,其技术细节也不仅相同,但其检测流程可以用四个主要的步骤进行概括:1)抽取视频关键帧;2)提取视频关键帧特征;3)执行基于视频关键帧特征的相似性查询;4)在关键帧特征相似性查询结果的基础上执行视频子序列匹配,实现对近重复视频的判别和定位。在这四个步骤中,关键帧的抽取方法已相对成熟,因此,目前对基于内容的近重复视频检测的研究主要集中在稳定的、高区分度的视频特征抽取,高效的特征相似性查询和准确的视频子序列匹配这三个方面。本文对这三方面的相关技术进行了总结,并在此基础上提出了我们的方法。 在近重复视频检测中的特征研究方面,本文做了两方面的工作:1)在SIFT(Scale Invariant Feature Transform)特征点集合基础上,提出了利用奇异值分解方法获取SVD-SIFT(Singular Value Decomposition-SIFT)特征。2)对SIFT描述子的描述方法进行了改进,提出了梯度序数特征,简称GOS(Gradient Ordinal Sig-nature)。相比于标准的SIFT描述子,在特征描述能力方面,SVD-SIFT和GOS基本上保存了原始SIFT描述子所具有的尺度不变性、旋转不变性等良好特性。其中GOS还新添了镜像不变特性,具有更好的适应性。但SVD-SIFT和GOS的计算更加简单,维数也大大降低,因而有效提高了系统的检测速度。 在近重复视频检测中的关键帧特征相似性查询研究方面,本文在分析排序类特征的一些内在特性的基础上,结合度量空间嵌入理论。提出了一种高效的相似性查询方法,基于固定点嵌入的相似性查询方法,简称FE(Fixed point-based Embedding)。FE源于一个简单的思想:如果原始空间中两个靠得很近的点,经过“嵌入”后在嵌入空间中可能仍然会靠得很近。而FE的收敛性能确保这种假设的成立。通过固定点嵌入后,高维空间中相似的数据点会投影到相同槽中,然后通过建立一个倒排索引结构执行高效的相似性查询。 在近重复视频检测中的视频子序列匹配研究方面,本文提出了基于图的视频子序列匹配算法。该方法将基于关键帧特征的相似性查询结果构建成匹配结果图,进而将近重复视频检测转换成了一一个在匹配结果图中查找最长路径的问题。该方法有三个主要优势:1)它能在众多杂乱的匹配结果中找到最佳的匹配序列,有效剔除了某些假“高相似度”匹配带来的噪声,因而它能在一定程度上弥补底层特征描述力的不足。2)由于它充分考虑和利用了视频序列的时序特性,从而具有很高的近重复视频定位准确度。3)它能自动检测出匹配结果图中存在的多条离散路径,从而能一次性检测出两段视频中可能存在多段近重复视频的情形。 最后,通过实验对本文提出的方法进行了评价。实验结果表明:本文提出的方法,在单个技术指标方面获得了接近于最好方法的性能。但将这些方法综合应用于近重复视频检测中,获得了更好的表现。
[Abstract]:With the improvement of broadband transmission network and the rapid development and wide application of video soft, hardware processing technology, especially with the rapid development of WEB2.0 technology, the content of network video is explosively growing and a large number of near repeated video are produced. A large number of near repetition video is produced to copyright protection, video content supervision In this context, the content based near duplicate video detection technology arises at the historic moment.
In this paper, the main near repetition video detection techniques are summarized. Although these methods have their own application scenes, their technical details are not only the same, but the detection process can be summarized in four main steps: 1) extracting video key frames; 2) extracting the feature of the video key frame; 3) executing the key frame feature based on the video. Similarity query; 4) performing video subsequence matching on the basis of the result of key frame feature similarity query to realize the discrimination and location of near repeated video. In these four steps, the extraction method of key frames is relatively mature, so the current research on content based near duplicate video detection is mainly concentrated in stable, high area The video feature extraction of indexing, efficient feature similarity query and accurate video subsequence matching are three aspects. This paper summarizes the related technologies of these three aspects and proposes our methods on the basis of this.
In the feature research of near repetition video detection, two aspects are done in this paper: 1) on the basis of SIFT (Scale Invariant Feature Transform) feature point set, we propose a singular value decomposition method to obtain SVD-SIFT (Singular Value Decomposition-SIFT) special.2) to improve the description of the SIFT descriptor. The gradient ordinal number feature, called GOS (Gradient Ordinal Sig-nature). Compared to the standard SIFT descriptor, the SVD-SIFT and GOS basically preserve the good properties of the scale invariance and rotation invariance of the original SIFT descriptors. In addition, GOS also adds a new image invariant feature, but has better adaptability. The computation of SVD-SIFT and GOS is simpler and the dimension is greatly reduced, which improves the detection speed of the system effectively.
In the research of key frame feature similarity query in near repetition video detection, this paper, based on the analysis of some inherent characteristics of the sort feature, combined with the metric space embedding theory, proposes an efficient similarity query method based on the fixed point embedded similarity query method, called FE (Fixed point-based Embedding).F. E comes from a simple idea that if two very close points in the original space are "embedded" in the embedded space, it may still be very close. And the convergence performance of the FE ensures the assumption that the similar data points in the high dimensional space will be projected into the same slot after a fixed point is embedded, and then by establishing one The inverted index structure performs an efficient similarity query.
In the research of video subsequence matching in near repetition video detection, this paper proposes a graph based video subsequence matching algorithm, which constructs a matching result map based on the similarity of key frame features, and then converts nearly repeated video detection into one of the longest paths in the matching result graph. This method has three main advantages: 1) it can find the best matching sequence in a large number of chaotic matching results, effectively eliminate the noise caused by some false "high similarity" matching, so it can make up for the insufficient.2 of the underlying feature description to a certain extent. Because it fully considers and uses the temporal characteristics of video sequence. In this way, it has a high accuracy of near repetition video positioning (.3). It can automatically detect multiple discrete paths that exist in the matching result graph, and can detect the possibility of multi segment near repetition video in two segments of video in one time.
Finally, the method is evaluated by the experiment. The experimental results show that the method proposed in this paper obtains the performance close to the best method in a single technical index. However, these methods are applied to the near repetition video detection and get a better appearance.

【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 李向明;沈夏;;基于视频检测的电子警察前端系统设计[J];通信电源技术;2010年02期

2 刘智勇,谢长寿;基于D-S证据理论的车辆视频检测方法[J];计算机工程;2003年12期

3 刘相莹;;智能交通中的车辆检测技术及其发展[J];科技信息(学术研究);2007年28期

4 高新波;田春娜;张娜;;一种基于SVM主动学习的卡通视频检测方法[J];电子与信息学报;2007年06期

5 蒋立正 ,吴群 ,张立民;串口联网技术在交通信息系统中的应用[J];电子产品世界;2004年04期

6 王命延;朱明峰;王昊;;机动车视频测速中关键技术的研究与实现[J];计算机工程;2006年05期

7 杨一麟;杨晨晖;;一种基于位置预判和模板匹配的车辆跟踪算法[J];福建电脑;2007年02期

8 杜蕾;;车辆视频检测算法的研究[J];科技资讯;2008年11期

9 曹洁;徐永胜;;基于D-S证据理论的车辆视频检测的研究[J];计算机仿真;2007年07期

10 闫富江;王东胜;王俊;;机器视觉技术在交通领域的应用探讨[J];黑龙江交通科技;2008年09期

相关会议论文 前10条

1 林文永;石志国;薛为民;陈锋军;;隐马尔可夫模型实现语音和视频识别[A];第一届学生计算语言学研讨会论文集[C];2002年

2 郭竞;;视频检测技术的应用[A];湖北省公路学会——2004年机电工程研讨会论文集[C];2004年

3 邢恩辉;王锐;贾元华;;视频检测技术在寒区城市快速路交通流特性研究的应用[A];第十二届中国体视学与图像分析学术会议论文集[C];2008年

4 秦钟;王法胜;;交叉口排队长度的视频检测[A];第二十九届中国控制会议论文集[C];2010年

5 李志慧;劳云腾;王殿海;祁宏生;;混合交通流视频检测中区域选择更新混合高斯背景模型研究[A];可持续发展的中国交通——2005全国博士生学术论坛(交通运输工程学科)论文集(上册)[C];2005年

6 吕同玲;任洪娥;马岩;;长条薄片刨花视频检测方法的探讨[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年

7 张盈盈;姚丹亚;吕克逊;;实时视频检测技术在城市交通管理规划中的应用[A];2008第四届中国智能交通年会论文集[C];2008年

8 史迎春;周献中;辛动军;骆文;张峰;;一种基于时空切片边缘分析的WIPE检测算法[A];2005中国控制与决策学术年会论文集(上)[C];2005年

9 陈喜群;杨新苗;史其信;;城市道路车牌识别系统在交通管理中的应用[A];2008第四届中国智能交通年会论文集[C];2008年

10 柯刚铠;胡坚明;姚丹亚;;一种适用于嵌入式平台的交通流视频检测方法[A];2008第四届中国智能交通年会论文集[C];2008年

相关重要报纸文章 前10条

1 毅力;Micro-Check视频检测系统[N];中国包装报;2002年

2 雷晓;用视频检测完成智能监控[N];中国交通报;2003年

3 徐颖 编译;视频检测系统帮我们得到接近完美的雕刻网穴[N];中国包装报;2002年

4 ;金属包装罐卷封质量视频检测仪[N];中国包装报;2005年

5 吴晓征;专家研讨高速公路信息化[N];安徽日报;2007年

6 记者 侯莎莎 通讯员 宋泽宇;6.6万人昨天上网查询路况[N];北京日报;2006年

7 本报记者 王力;加强管理和提高素质 为缓解交通两难“破题”[N];杭州日报;2007年

8 记者 朱盈洁;大企业申报数量增加[N];首都建设报;2006年

9 邢梦宇 汪秀芬;“美的”风扇:吹开快速通关大门[N];中国贸易报;2007年

10 记者 马瑜;昌吉市区道路安装“电子眼”[N];昌吉日报;2007年

相关博士学位论文 前10条

1 刘红;近重复视频检测算法研究[D];复旦大学;2012年

2 江晟;混合交通视频检测关键技术研究[D];吉林大学;2013年

3 马增强;运动车辆视频检测与分割方法研究[D];北京交通大学;2011年

4 朱诺;基于视频检测和元胞自动机的人群疏散机理研究[D];北京交通大学;2012年

5 李娟;城市交通系统中行人交通视频检测的理论与方法[D];北京交通大学;2010年

6 吴骏;智能交通系统中的信息处理关键技术研究[D];天津大学;2007年

7 曲昭伟;混合交通视频检测算法研究[D];吉林大学;2009年

8 李晗;同步检测线方法及其在轨道交通中的应用[D];浙江大学;2005年

9 李琦;面向行人群信息提取的视频图像目标跟踪算法研究[D];北京交通大学;2013年

10 洪晓鹏;新型二阶统计描述子及其在物体检测与跟踪方面的应用[D];哈尔滨工业大学;2010年

相关硕士学位论文 前10条

1 赵茵茵;基于FPGA的视频检测系统的设计[D];北京交通大学;2010年

2 沈涛;基于视频检测的行人交通参数提取技术研究[D];北京交通大学;2011年

3 刘艳民;基于运动特征的不良视频检测算法研究[D];兰州大学;2010年

4 李杨;视频检测中高斯分布模型的应用[D];吉林大学;2008年

5 刘永祥;基于视频检测的电子警察前端系统研究与设计[D];武汉科技大学;2010年

6 陈攀;基于特征部位和肤色的不良视频检测的算法研究[D];华中师范大学;2011年

7 谢恩;基于视频检测的闯红灯记录仪研究与设计[D];华中科技大学;2005年

8 林涛;视觉交通检测技术的研究[D];天津大学;2005年

9 李爱军;基于帧差法的交通图像形态学滤波处理方法的研究[D];沈阳工业大学;2006年

10 蔡光明;高速铁路桥梁底面裂缝的视频检测系统研究[D];北京交通大学;2011年



本文编号:1893745

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1893745.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d5428***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com