当前位置:主页 > 文艺论文 > 广告艺术论文 >

基于内容的相似音视频检测及广告检测

发布时间:2017-09-12 15:33

  本文关键词:基于内容的相似音视频检测及广告检测


  更多相关文章: 相似音视频检测 广告检测 FWASF 加权金字塔匹配算法 文字检测


【摘要】:随着互联网的飞速发展及数据量的迅猛膨胀,搜索技术成为了人们获取信息最重要的方式,人们不在局限于以文字作为搜索的入口,随着相似音视频的检测技术(Content-Based Copy Detection,CBCD)的进步,使得人们以音视频作为搜索入口变为可能,这已经发展成了一个非常有潜力、有价值的方法。 本文提出了一种新的相似音频搜索框架,主要工作及创新有: 1、在音频提取特征阶段,提出了一种改进的音频特征FWASF以及相应的音频滤波算法,能有效消除由7种音频变换带来的失真。 2、在音频索引阶段,设计并实现了局部敏感哈希(Locality Sensitive Hash, LSH),结合倒排所索引建立了高效的索引结构。 3、在融合音频帧结果阶段,提出并实现了基于权重的时间金字塔匹配算法,并据此将音频帧搜索结果合成音频检索结果。 在TRECVID数据集上的实验验证了算法的有效性。 随着互联网的发展,广告的发布渠道已经从传统的电视渠道蔓延到了互联网平台上,互联网广告的一大特征就是传播速度快、传播效应大,如何有效地采集、监管这些广告就成为了急需解决的问题。 本文提出了一种基于学习的广告检测系统,主要工作及创新有: 1、设计并实现了一种基于Harris角点及决策树的文字区域检测方法,此方法能有效检测出广告视频中的文字区域。 2、在镜头分割的基础上,提出了基于镜头特征的广告检测方法,提出并实现了多种基于文字区域的特征,作为其他音视频特征的有力补充。 3、设计并实现了一种基于相邻镜头的特征提取方法,并提出了多种后处理方法来改善检测结果。
【关键词】:相似音视频检测 广告检测 FWASF 加权金字塔匹配算法 文字检测
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.41;TN912.3
【目录】:
  • 摘要4-5
  • ABSTRACT5-7
  • 目录7-10
  • 第一章 绪论10-18
  • 1.1 课题研究的背景及意义10-12
  • 1.1.1 基于内容的相似音视频检测的研究背景和意义10-11
  • 1.1.2 视频广告识别的研究背景和意义11-12
  • 1.2 国内外研究现状12-16
  • 1.2.1 基于内容的相似音视频检测的国内研究现状12-14
  • 1.2.2 视频广告识别的国内研究现状14-16
  • 1.3 论文的内容安排16-18
  • 1.3.1 主要研究内容16-17
  • 1.3.2 论文结构安排17-18
  • 第二章 基于内容的重复音频检测18-39
  • 2.1 引言18
  • 2.2 基于内容的音频检测中的关键技术18-20
  • 2.2.1 音频特征提取18-19
  • 2.2.2 索引结构19-20
  • 2.3 重复音视频检测系统框架20-21
  • 2.4 音频预处理21-26
  • 2.4.1 音频帧提取21
  • 2.4.2 离散傅里叶变换21-22
  • 2.4.3 归一化22
  • 2.4.4 噪声滤波器组22-24
  • 2.4.5 人耳响应滤波器24-25
  • 2.4.6 逆滤波器25
  • 2.4.7 预加重窗25
  • 2.4.8 汉明滤波器组25-26
  • 2.5 FWASF特征计算26-29
  • 2.5.1 特征选择26
  • 2.5.2 特征计算预处理26
  • 2.5.3 ASF特征26-28
  • 2.5.4 FASF特征28-29
  • 2.5.5 FWASF特征29
  • 2.6 后处理29-30
  • 2.7 建立索引30-33
  • 2.8 时间金字塔匹配算法33-35
  • 2.9 基于内容的相似音频检测实验结果与分析35-38
  • 2.9.1 实验数据35-36
  • 2.9.2 评测标准36
  • 2.9.3 实验结果36-37
  • 2.9.4 实验总结37-38
  • 2.10 本章小结38-39
  • 第三章 视频的广告识别39-59
  • 3.1 引言39-42
  • 3.1.1 镜头边界检测39-40
  • 3.1.2 SVM基本原理40-42
  • 3.2 系统框架42
  • 3.3 镜头特征的提取42-46
  • 3.3.1 边缘变化率42-43
  • 3.3.2 帧间差43
  • 3.3.3 镜头切变率43-44
  • 3.3.4 字幕帧比率44
  • 3.3.5 文字特征44-45
  • 3.3.6 联系上下文的镜头特征45-46
  • 3.4 文字区域检测46-53
  • 3.4.1 系统框架47-48
  • 3.4.2 粗文字检测48
  • 3.4.3 小波变换检测48-49
  • 3.4.4 Harris角点检测49-51
  • 3.4.5 特征描述51-53
  • 3.5 广告识别结果的修正53
  • 3.6 广告分条53-54
  • 3.7 视频广告识别的实验结果与分析54-56
  • 3.7.1 实验数据54-55
  • 3.7.2 评测标准55
  • 3.7.3 实验结果55-56
  • 3.7.4 实验总结56
  • 3.8 文字区域检测的结果与分析56-58
  • 3.8.1 实验数据56
  • 3.8.2 评测标准56-57
  • 3.8.3 实验结果57
  • 3.8.4 实验总结57-58
  • 3.9 本章小结58-59
  • 第四章 总结与展望59-62
  • 4.1 论文总结59-60
  • 4.1.1 基于内容的相似引视频检测59
  • 4.1.2 广告识别系统59-60
  • 4.2 工作展望60-62
  • 4.2.1 基于内容的相似音视频检测60-61
  • 4.2.2 广告识别系统61-62
  • 参考文献62-66
  • 致谢66

【参考文献】

中国期刊全文数据库 前5条

1 冯扬;罗森林;王丽萍;潘丽敏;;一种新的自适应镜头边界检测算法[J];北京理工大学学报;2010年01期

2 丁洪丽;陈怀新;;基于累积直方图的视频镜头边界检测方法[J];电讯技术;2008年03期

3 刘楠;赵耀;朱振峰;;基于Co-Training策略的视频广告文本检测[J];北京交通大学学报;2010年05期

4 卢炎生;饶祺;;一种LSH索引的自动参数调整方法[J];华中科技大学学报(自然科学版);2006年11期

5 郑方 ,张国亮 ,宋战江;Comparison of Different Implementations of MFCC[J];Journal of Computer Science and Technology;2001年06期

中国博士学位论文全文数据库 前1条

1 曹政;电视节目自动分割与相似视频检索[D];中国科学技术大学;2010年



本文编号:838049

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/838049.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户97c56***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com