当前位置:主页 > 科技论文 > 网络通信论文 >

基于音频内容重复性的广播广告检测

发布时间:2020-11-14 21:58
   在现如今,广播是人们接收新闻、歌曲、娱乐节目等信息的重要途径。由于广播具有受众面广,影响力大的特点,对于广播节目中的广告检测具有很重要的现实意义。广告检测对于政府监管,媒体运营,广告投放等工作都具有很大的帮助作用。针对上述实际需求,本文提出了一种基于音频内容重复性的广播中广告检测方法。该方法的主要思想是结合广播节目中同一广告在固定时段出现频率高、数量大的特性,通过找出广播中音频内容的重复段来确定广告及其位置。本文提出的这种方法具有计算速度快,无需大量人力投入等特点。本文的主要工作如下:1.对目标音频进行自相似性矩阵的计算。通过自相似性矩阵得到音频中内容相似重复的音频段作为相似段,并对出现多次的相似段进行剔除,得到最终的广告和起止时间。2.使用基于音频分类分割的方法对广告检测算法进行优化。使用支持向量机对未知音频进行分类,共分为语音,含噪语音,背景音,音乐共四类,并对支持向量机分类得到的分类结果进行平滑,并根据平滑后的结果得到音频分割点。3.使用梯度提升树对广告音频与非广告音频进行分类,基于音频重复性的广告检测算法存在局限性,未重复出现的广告不能通过该方法检测出来。因此本文使用基于梯度提升树的广告检测算法检测音频段中未重复出现的广告。最后将两种方法的检测结果结合起来。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TN931
【部分图文】:

对比图,过零率,对比图,音频


本节对第 2 章中涉及到的音频特征进行实验以区分上述四种音频内容。本节所用的实验数据时长 4 分钟、语音、含噪语音、背景音四种内容类型。每种类型的音 分钟。四个音频片段在时间上按照歌曲、语音、含噪语音次拼接。实验数据为单声道音频文件,采样率为 8000Hz。 50ms,帧移为 25ms。通过实验数据对过零率、短时能量、能量熵、频谱中心、通量、频谱滚降点、谱熵这 8 种特征在四种音频内容的区本节将使用实验音频计算每一种音频特征。并将计算结果坐标,音频特征数值为纵坐标的坐标系中。 过零率音频数据的过零率曲线如图 4-1 所示,不同类型音频通过。在时间轴上从左到右的音频分别属于音乐、语音、含噪

对比图,短时能量,对比图,零率


背景音与语音的过零率居中,音乐的过零率最低。区分含有语音的音频段与音乐段。高过零率比率是关于过由于音乐和噪声的帧过零率普遍较低,故音乐和噪音的高 0。因此高过零率比率同样可以很好的区分语音与非语音高过零率比率特征适用于上述四种类型音频的分类任务。 短时能量 4-2 中我们可以发现,语音的平均短时能量最高,音乐其均短时能量较语音和音乐相比显著减少。背景音的短时能 0。由于四种类型的音频在短时能量特征上的显著差异,分类模型使用的特征之一。低能帧比率是短时能量的统计能将不同类型音频短时能量特征上的差异进一步的放大。以作为分类器使用的特征。

能量,熵特征,学位论文,时域


能量熵对比图
【参考文献】

相关期刊论文 前3条

1 张玉珍;夏肇霖;王建宇;戴跃伟;;基于音频和文本融合的广告单元分割[J];南京理工大学学报;2012年03期

2 姜洪臣;任晓磊;赵耀宏;徐波;;基于音频语谱图像识别的广告检索[J];清华大学学报(自然科学版);2011年09期

3 刘祥楼;贾东旭;李辉;姜继玉;;说话人识别中支持向量机核函数参数优化研究[J];科学技术与工程;2010年07期


相关硕士学位论文 前4条

1 熊晨辉;基于音频匹配的广告监播技术研究[D];电子科技大学;2016年

2 曹雪昭;音频广告检测算法研究[D];上海交通大学;2015年

3 张杨;基于内容的相似音视频检测及广告检测[D];北京邮电大学;2014年

4 聂华;基于音频指纹的广告检测技术研究[D];湘潭大学;2011年



本文编号:2883995

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2883995.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c9d3b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com