当前位置:主页 > 文艺论文 > 广告艺术论文 >

基于多维特征提取的视频内容识别系统设计与实现

发布时间:2020-07-22 06:25
【摘要】:视频内容识别是通过对视频的分析得到视频所要表达的主题,是一种对视频进行抽象概述的行为。视频内容识别对于目前信息网络的发展具有重要意义。思科公布的互联网预测报告显示未来五年内全球的互联网流量增长近三倍,个人互联网流量的比例将增长到82%。视频内容服务已是信息网络中的主流业务,如何处理与分析海量的视频内容成了亟待解决的问题。如识别广播视频中的广告内容,网络视频中的违禁镜头等。视频内容识别通过分析视频得出简要抽象的结果,更能够满足视频数量巨大的信息网络的发展需求。广告包含丰富的商业信息。本文以视频广告为例,设计了视频内容识别系统,用于识别广告内容。广告是抽象的视频描述,为了识别广告内容,需要检测视频中的镜头边界,以镜头为单位判断视频是否为广告。因为非广告镜头中也会出现商标或广告语等广告特征,需要在确定是广告的基础上进一步识别出是什么广告。已有的工作中,镜头边界检测算法计算效率低,镜头分类的方法也无法满足视频类型多样的情况。本文结合卷积神经网络与传统的计算机视觉处理技术,综合图像和音频的多维特征进行视频内容识别,设计并实现了完整的视频内容识别系统。本文的具体贡献主要有如下三个方面。(1)基于实验数据,提出了新的镜头边界检测方法。基于真实的广播数据,使用颜色特征设计了一种新的镜头边界检测方法。相比于其他方法,本文的方法计算简单,能够降低镜头渐变的影响,方便后续的镜头分类和内容识别工作。(2)提出一种新的镜头特征提取方法,即使用卷积神经网络提取镜头特征,并利用该特征将镜头分为广告与非广告两类。传统的视频特征如颜色、纹理等,只能进行低维具体描述,而使用卷积神经网络提取的镜头特征,具有高维抽象表达的能力,而且计算效率高。使用该特征训练支持向量机分类器,将镜头分为广告与非广告两类,精确率与召回率分别达到93.74%和95.33%。(3)综合视频中图像与音频的特征,设计并实现了视频内容识别系统。之前的视频识别方法大多只使用了图像特征或者将图像与音频在特征层融合后进行识别。本文设计了新的识别方法,分别使用图像特征和音频特征进行视频内容识别,并在结果层融合,提升镜头的识别准确率。在此基础上将识别结果提升到广告层级,最终广告识别的精确率和召回率分别达到90%和98.02%。本文提出的方法有很强的泛化能力,只需要提供对应的训练数据,便能够适用于违禁镜头检测等视频分类任务。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.41
【图文】:

差分图像,差分图,极值点,高斯


邋cr)邋=邋(G(x,邋y,邋kcr)邋-邋G(x,cr))邋*邋I(x,邋y)逡逑=L(x,邋y,邋kcr)邋-邋L(x,cr)逡逑图2-1展示了由高斯尺度空间生成高斯差分尺度空间的过程,第二步是寻找高逡逑斯差分尺度空间的极值点,如图2-2所示:逡逑<??*!邋逦逦逦逡逑-:U;-邋.逦^逡逑Difeence邋of逡逑{Saysn糯危牵螅酰螅螅椋幔铄澹模模彦义贤迹玻备咚雇枷裼敫咚共罘滞枷瘢ú慰嘉南祝郏担埃荩╁义希疲椋纾酰颍邋澹玻卞澹牵幔酰螅螅椋幔铄澹桑恚幔纾澹箦澹幔睿溴澹模椋妫妫澹颍澹睿悖邋澹铮驽澹牵幔酰螅螅椋幔铄澹桑恚幔纾澹螅ǎ颍澹妫澹颍颍澹溴澹簦镥澹郏担埃荩╁义细鲥未蹂义希樱悖幔欤邋义希阂遥哄义希澹义贤迹玻哺咚共罘滞贾械募档悖ú慰嘉南祝郏担埃荩╁义希疲椋纾酰颍邋澹玻插澹牛簦颍澹恚邋澹校铮椋睿翦澹铮驽澹模椋妫妫澹颍澹睿悖邋澹铮驽澹牵幔酰螅螅椋幔铄澹桑恚幔纾澹螅ǎ颍澹妫澹颍颍澹溴澹簦镥澹郏担埃荩╁义铣叨瓤占涞募档阋蟾玫愕闹荡笥诨蛐∮谒邢嗔诘牡悖ㄉ喜悖垢龅悖义舷虏悖垢龅阌胫芪В父龅悖玻玻陡鱿嗔诘恪U业剿屑档愫螅枰员榷缺儒义辖系偷囊约按τ诒咴档牟晃榷ǖ牡闵境嘞碌募档阕魑卣鞯憬忻枋觥5阱义先勘闶歉锰卣鞯愀秤枰桓觯保玻肝姆较虿问渥龇ㄊ抢霉丶懔谟蛳袼劐义系奶荻确较蚍植继匦岳锤恳桓龉丶阒付ǚ较虿问庋瞿芄皇垢妹枋鼍哂绣义闲槐湫浴9剑玻保

本文编号:2765446

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2765446.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户11763***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com