基于内容的相似音视频检测及广告检测
发布时间:2017-09-12 15:33
本文关键词:基于内容的相似音视频检测及广告检测
更多相关文章: 相似音视频检测 广告检测 FWASF 加权金字塔匹配算法 文字检测
【摘要】:随着互联网的飞速发展及数据量的迅猛膨胀,搜索技术成为了人们获取信息最重要的方式,人们不在局限于以文字作为搜索的入口,随着相似音视频的检测技术(Content-Based Copy Detection,CBCD)的进步,使得人们以音视频作为搜索入口变为可能,这已经发展成了一个非常有潜力、有价值的方法。 本文提出了一种新的相似音频搜索框架,主要工作及创新有: 1、在音频提取特征阶段,提出了一种改进的音频特征FWASF以及相应的音频滤波算法,能有效消除由7种音频变换带来的失真。 2、在音频索引阶段,设计并实现了局部敏感哈希(Locality Sensitive Hash, LSH),结合倒排所索引建立了高效的索引结构。 3、在融合音频帧结果阶段,提出并实现了基于权重的时间金字塔匹配算法,并据此将音频帧搜索结果合成音频检索结果。 在TRECVID数据集上的实验验证了算法的有效性。 随着互联网的发展,广告的发布渠道已经从传统的电视渠道蔓延到了互联网平台上,互联网广告的一大特征就是传播速度快、传播效应大,如何有效地采集、监管这些广告就成为了急需解决的问题。 本文提出了一种基于学习的广告检测系统,主要工作及创新有: 1、设计并实现了一种基于Harris角点及决策树的文字区域检测方法,此方法能有效检测出广告视频中的文字区域。 2、在镜头分割的基础上,提出了基于镜头特征的广告检测方法,提出并实现了多种基于文字区域的特征,作为其他音视频特征的有力补充。 3、设计并实现了一种基于相邻镜头的特征提取方法,并提出了多种后处理方法来改善检测结果。
【关键词】:相似音视频检测 广告检测 FWASF 加权金字塔匹配算法 文字检测
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.41;TN912.3
【目录】:
- 摘要4-5
- ABSTRACT5-7
- 目录7-10
- 第一章 绪论10-18
- 1.1 课题研究的背景及意义10-12
- 1.1.1 基于内容的相似音视频检测的研究背景和意义10-11
- 1.1.2 视频广告识别的研究背景和意义11-12
- 1.2 国内外研究现状12-16
- 1.2.1 基于内容的相似音视频检测的国内研究现状12-14
- 1.2.2 视频广告识别的国内研究现状14-16
- 1.3 论文的内容安排16-18
- 1.3.1 主要研究内容16-17
- 1.3.2 论文结构安排17-18
- 第二章 基于内容的重复音频检测18-39
- 2.1 引言18
- 2.2 基于内容的音频检测中的关键技术18-20
- 2.2.1 音频特征提取18-19
- 2.2.2 索引结构19-20
- 2.3 重复音视频检测系统框架20-21
- 2.4 音频预处理21-26
- 2.4.1 音频帧提取21
- 2.4.2 离散傅里叶变换21-22
- 2.4.3 归一化22
- 2.4.4 噪声滤波器组22-24
- 2.4.5 人耳响应滤波器24-25
- 2.4.6 逆滤波器25
- 2.4.7 预加重窗25
- 2.4.8 汉明滤波器组25-26
- 2.5 FWASF特征计算26-29
- 2.5.1 特征选择26
- 2.5.2 特征计算预处理26
- 2.5.3 ASF特征26-28
- 2.5.4 FASF特征28-29
- 2.5.5 FWASF特征29
- 2.6 后处理29-30
- 2.7 建立索引30-33
- 2.8 时间金字塔匹配算法33-35
- 2.9 基于内容的相似音频检测实验结果与分析35-38
- 2.9.1 实验数据35-36
- 2.9.2 评测标准36
- 2.9.3 实验结果36-37
- 2.9.4 实验总结37-38
- 2.10 本章小结38-39
- 第三章 视频的广告识别39-59
- 3.1 引言39-42
- 3.1.1 镜头边界检测39-40
- 3.1.2 SVM基本原理40-42
- 3.2 系统框架42
- 3.3 镜头特征的提取42-46
- 3.3.1 边缘变化率42-43
- 3.3.2 帧间差43
- 3.3.3 镜头切变率43-44
- 3.3.4 字幕帧比率44
- 3.3.5 文字特征44-45
- 3.3.6 联系上下文的镜头特征45-46
- 3.4 文字区域检测46-53
- 3.4.1 系统框架47-48
- 3.4.2 粗文字检测48
- 3.4.3 小波变换检测48-49
- 3.4.4 Harris角点检测49-51
- 3.4.5 特征描述51-53
- 3.5 广告识别结果的修正53
- 3.6 广告分条53-54
- 3.7 视频广告识别的实验结果与分析54-56
- 3.7.1 实验数据54-55
- 3.7.2 评测标准55
- 3.7.3 实验结果55-56
- 3.7.4 实验总结56
- 3.8 文字区域检测的结果与分析56-58
- 3.8.1 实验数据56
- 3.8.2 评测标准56-57
- 3.8.3 实验结果57
- 3.8.4 实验总结57-58
- 3.9 本章小结58-59
- 第四章 总结与展望59-62
- 4.1 论文总结59-60
- 4.1.1 基于内容的相似引视频检测59
- 4.1.2 广告识别系统59-60
- 4.2 工作展望60-62
- 4.2.1 基于内容的相似音视频检测60-61
- 4.2.2 广告识别系统61-62
- 参考文献62-66
- 致谢66
【参考文献】
中国期刊全文数据库 前5条
1 冯扬;罗森林;王丽萍;潘丽敏;;一种新的自适应镜头边界检测算法[J];北京理工大学学报;2010年01期
2 丁洪丽;陈怀新;;基于累积直方图的视频镜头边界检测方法[J];电讯技术;2008年03期
3 刘楠;赵耀;朱振峰;;基于Co-Training策略的视频广告文本检测[J];北京交通大学学报;2010年05期
4 卢炎生;饶祺;;一种LSH索引的自动参数调整方法[J];华中科技大学学报(自然科学版);2006年11期
5 郑方 ,张国亮 ,宋战江;Comparison of Different Implementations of MFCC[J];Journal of Computer Science and Technology;2001年06期
中国博士学位论文全文数据库 前1条
1 曹政;电视节目自动分割与相似视频检索[D];中国科学技术大学;2010年
,本文编号:838049
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/838049.html