电视广告监管系统的设计和实现
本文选题:音频 + 语音匹配 ; 参考:《浙江大学》2006年硕士论文
【摘要】:随着经济的发展,电视广告成为社会生活中越来越重要的一部分,而其带来的社会问题也日渐显著,特别是虚假广告严重误导了消费者,坑害了广大人民,因此广告监管成为社会急需处理的问题。 本文根据实际的项目要求设计了一套适合广告监管的系统,它主要可以分为视频采集、音频匹配和用户界面这几部分,并重点研究了适合电视广告监管的音频匹配算法。 本文在总结语音识别和音乐检索技术的基础上,成功的实现了广告音频匹配算法。整个算法可以分成音频特征提取和音频模板匹配两大部分。 在音频特征提取阶段,本文借鉴了音乐检索中主流的两种音频特征:音高和MFCC特征参数,并设计了一套实验来选择对广告音频有更强区分能力的特征。根据实验结果MFCC特征参数具有更好的识别能力,因此它将作为整个音频匹配算法中使用的音频特征参数。 在音频模板匹配阶段,为了解决MFCC特征参数数据量过大、比较速度过慢以及广告音频中出现的多帧、丢帧等问题,本文应用了矢量量化技术、多级匹配算法和DTW算法。 在矢量量化中,针对难以为整个广告样本库建立一个统一码本的情况,本文采用为单一广告分别建立码本的方法,并在量化时把不属于该广告空间的矢量统一划入另一区域来提高匹配时的精确度。 在多级匹配算法中,采用了广告头比较来寻找广告开始帧的位置,用整个广告比较来确认广告头找出的开始帧位置是否正确。这种改进算法使匹配速度有了很大的提高。 在确定了音频模板的匹配算法以后,本文又设计了一套实验来检测该算法的有效性,实验表明,在准确率没有明显下降的情况下,速度有了很大的提升。 最后本文就整个项目的实现,进行了说明。
[Abstract]:With the development of economy , TV advertising has become a more and more important part of social life , and the social problems brought by it are becoming more and more obvious , especially the false advertisement seriously misled consumers , and harmed the people , so advertising supervision has become the problem of social emergency treatment .
According to the actual project requirement , a system suitable for advertisement supervision is designed , which can be divided into two parts : video acquisition , audio matching and user interface , and the audio matching algorithm suitable for TV commercial supervision is researched .
On the basis of summarizing the technology of speech recognition and music retrieval , this paper successfully realizes the advertisement audio matching algorithm . The whole algorithm can be divided into two parts : audio feature extraction and audio template matching .
At the stage of audio feature extraction , this paper draws on two kinds of audio features in music retrieval : pitch and MFCC feature parameters , and designs a set of experiments to select features that have stronger distinguishing ability for the advertisement audio . According to the experimental results , the MFCC feature parameters have better recognition capability , so it will be used as the audio feature parameter used in the whole audio matching algorithm .
In this paper , vector quantization , multilevel matching algorithm and DTW algorithm are applied in order to solve the problems of too large data volume , too slow speed of comparison and multi - frame and frame loss occurring in advertisement audio in the matching stage of audio template .
In the vector quantization , in the case of difficulty in establishing a uniform codebook for the entire advertisement sample library , a method for establishing a codebook for a single advertisement is adopted , and the accuracy of matching is improved when the vector which does not belong to the advertisement space is uniformly drawn into another area at the time of quantization .
in that multi - stage matching algorithm , the position of the advertisement start frame is searched by the comparison of the advertisement head , and the whole advertisement comparison is used to confirm whether the position of the start frame found by the advertisement head is correct .
After confirming the matching algorithm of the audio template , this paper designs a set of experiments to detect the effectiveness of the algorithm .
In the end , this paper describes the whole project .
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.52
【相似文献】
相关期刊论文 前10条
1 蒋先德;;多媒体远程教室的规划和设计[J];电脑知识与技术;2011年20期
2 郭小华;丁学恭;陈岁生;;基于无线传感器网络的岩体声发射信号监测系统[J];电子技术应用;2011年03期
3 顾勇;赵建明;;基于Wolfson音频SoC的I~2C总线接口设计[J];物联网技术;2011年04期
4 徐永生;;有线数字电视机顶盒检测详解[J];电视技术;2011年14期
5 友文;;让老本用上SRS音效驱动[J];电脑知识与技术(经验技巧);2011年06期
6 方继坤;;用DAC改装板摩CD机[J];实用影音技术;1999年07期
7 ;音乐本无疆 收听勿有界 无线音频总动员[J];电脑爱好者;2011年11期
8 陈晓军;;随心所欲调节视频中声音大小[J];电脑爱好者;2011年11期
9 ;新产品[J];电子世界;2010年09期
10 ;欧胜推出世界首款音频系统级芯片(Audio SoC)[J];电子设计工程;2011年16期
相关会议论文 前10条
1 白艳平;秦玉文;樊海波;曲日;;一种新的复合材料检测技术的应用研究[A];“力学2000”学术大会论文集[C];2000年
2 孟祥彬;戴璐;;测量传声器应用及市场分析[A];2009年声频工程学术交流年会论文集[C];2009年
3 刘宝会;秦玉文;侯振德;陈金龙;;数字错位散斑术的自控音频激振加载研究[A];第二届全国信息获取与处理学术会议论文集[C];2004年
4 李明;吕萍;韩疆;颜永红;;固定音频检索的方法和实现[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
5 吕萍;王炜;颜永红;;音频匹配技术及其在音频检索中的应用[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
6 耿少波;;流媒体关键技术[A];2006全国广播电视发射技术论文集(1)[C];2006年
7 陈惠珍;李玉南;;音频加超短波治疗腹部手术后肠粘连——附三十例报告[A];中国康复医学会第三次康复治疗学术大会论文汇编[C];2002年
8 贾磊;徐波;;基于检测熵变化趋势的音频特征跳变点检测[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 朱觉;;多声道数字立体声录音制作[A];中国电影电视技术学会影视科技论文集[C];2002年
10 费玉莲;凌云;王勋;;基于增强隐马尔可夫模型的视频数据挖掘研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
相关重要报纸文章 前10条
1 记者 郭静 通讯员肖金;警惕“音频毒品”诱发心理问题[N];广东科技报;2009年
2 本报记者 程竹;“音频毒品”网站该不该禁[N];中国文化报;2009年
3 刘继滨 首席记者 陈洋;警方提醒:此类音频有可能产生幻觉[N];黑龙江经济报;2010年
4 特约作者 林枫 电脑报 吴新;听音自由 无线音频潮涌[N];电脑报;2010年
5 冯晓芳 黄全权;中国音频业发展翻开新一页[N];民营经济报;2009年
6 陈会安;丢掉讨厌的音频线[N];中国电脑教育报;2003年
7 福建 郑子龙;抓取VCD中的音频[N];电脑报;2002年
8 叶真;光驱音频线接PS/2鼠标[N];中国计算机报;2001年
9 吴东;高贵不贵的音频伴侣[N];中国计算机报;2003年
10 爱清;超长WMA音频转CD[N];计算机世界;2004年
相关博士学位论文 前9条
1 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
2 刘宝会;多功能数字散斑干涉无损检测技术及应用研究[D];天津大学;2004年
3 汝学民;音频隐写与分析技术研究[D];浙江大学;2006年
4 汪斌;音频编解码算法及软硬件协同设计研究[D];浙江大学;2004年
5 郑贤中;高指向性音频声波理论与控制研究[D];华中科技大学;2006年
6 陈铭;隐写与隐写分析算法及实践研究[D];北京邮电大学;2008年
7 赵亚琴;基于内容的视频片段检索技术研究[D];南京理工大学;2007年
8 熊华;视频内容结构化技术的研究与实现[D];中国人民解放军国防科学技术大学;2001年
9 殷复莲;同步CDMA系统NBI识别及抑制技术研究[D];哈尔滨工程大学;2010年
相关硕士学位论文 前10条
1 程捷;辅助视频内容分析的音频技术研究与实现[D];中国人民解放军国防科学技术大学;2003年
2 丁翔;基于虚拟仪器的手机扬声器测试系统的设计与实现[D];苏州大学;2006年
3 张晓e,
本文编号:1822435
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/1822435.html