【摘要】:随着计算机技术、视频压缩技术和互联网技术的迅猛发展,人们可访问的信息资源空前丰富。视频资料因其具有直观性、信息综合性的特点,在数据库中的地位日渐增强,其数量增长更是惊人。但同时,由于视频结构的复杂性、数据内容的多样性以及时空多维性的特点,致使如何有效地组织视频数据、快速地检索和浏览用户需求的视频信息等成为视频领域内亟待解决的重大课题。在这种背景之下,基于内容的视频检索技术应运而生,它综合了图像处理、人工智能、模式识别及计算机视觉等领域的相关理论知识,并对视频特征和视频对象进行深入分析和研究,旨在获得蕴含在视频中的高层语义信息,建立可用的视频检索体系。因此,对视频语义的分析和检索技术的研究具有广阔的前景和现实意义。 本文以影视类视频、球拍类体育视频和新闻类视频为研究对象,融合了视频中的视觉、音频等多模态信息,对各种视频进行了有针对性的语义分析和检索方法研究。影视类视频语义分析从情感角度展开,分析了此类视频的视觉低层情感特征与音频的情感特征,基于未确知测度模型对影视类视频场景的情感类型进行了检测和识别。通过分析球拍类体育视频的视觉、音频特征,对视频中的感兴趣事件进行语义识别和检索研究。基于条件随机场模型,比较系统的研究了新闻类视频故事场景的检测和分割方法。主要工作如下: (1)通过分析影视类视频的低层视觉情感特征和音频情感特征,基于未确知测度理论,提出了一种视频情感内容识别的新算法。该方法先分析了影视类视频的场景亮度、镜头切变率、色调效能三个视觉类情感特征和多种音频情感特征,介绍了每种视频情感特征的数据提取方法,并分别构建了影视类视频场景的视觉情感特征向量和音频情感特征向量。其次,定义了视频情感识别的对象空间和指标空间,构造了各视听情感特征的未确知测度函数和未确知测度矩阵。最后,采用信息熵确定情感特征向量中各分量的权位,用置信度识别准则对视频场景的情感类型进行识别和判定。实验结果表明所捉算法是有效的、可行的。 (2)提出一种融合视觉、音频特征信息的球拍类体育视频精彩片段检索的算法。首先,基于支持向量机(Support Vector Machine, SVM)视频镜头分类与帧图像边缘特征的方法,将视频流中的镜头分为比赛镜头(Court View Shot)和非比赛镜头(Non-Court View Shot)两类;然后,分析了球拍类体育视频中声音和感兴趣事件之间的内在联系,构建了一个基于击球声和掌声的SVM分类器模型;最后,将镜头分类与声音事件分类进行融合,并建立了视频中精彩片段的提取规则,并对检索结果进行了排序处理。 (3)提出了一种基于条件随机场模型的新闻故事识别和检索方法。该方法首先对新闻视频的音频内容和结构特征进行分析,应用规则分类和隐马尔可夫模型(Hidden Markov Model, HMM)分类相结合的方法将新闻视频中的音频数据进行分层、细化处理,并按照语义将其分类为男主播语音、女主播语音、交替播报、现场声音、介分音乐和有效静音六种。接着,通过分析新闻视频中镜头的特点,将新闻类视频按照语义分为主播镜头、静态画面镜头、现场访录镜头、广告镜头和其它类镜头五种,辅以音频语义信息对视频中的镜头进行了识别和分类。在完成新闻类视频音频语义分类和镜头语义识别的基础之上,通过相应的关键词序列的转换,构建了新闻故事场景的条件随机场(Conditional Random Fields, CRFs)分割提取模型,对新闻类视频进行了较为成功的语义识别和检索。 (4)设计并初步实现了一个基于内容的视频语义识别和检索的实验平台,验证了上述所提算法的性能。
[Abstract]:......
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP391.41
【参考文献】
相关期刊论文 前10条
1 张龙飞;曹元大;周艺华;李剑;;基于支持向量机元分类器的体育视频分类[J];北京理工大学学报;2006年01期
2 冯扬;罗森林;王丽萍;潘丽敏;;一种新的自适应镜头边界检测算法[J];北京理工大学学报;2010年01期
3 张石清;赵知劲;雷必成;杨广映;;结合音质特征和韵律特征的语音情感识别[J];电路与系统学报;2009年04期
4 闫乐林;温向明;郑伟;张良;;基于未确知测度的视频情感内容识别[J];东南大学学报(自然科学版);2011年03期
5 彭宇新,Ngo Chong-Wah,肖建国;一种基于二分图最优匹配的镜头检索方法[J];电子学报;2004年07期
6 王光远;;未确知信息及其数学处理[J];哈尔滨建筑工程学院学报;1990年04期
7 潘磊,吴小俊,尤媛媛;基于聚类的视频镜头分割和关键帧提取[J];红外与激光工程;2005年03期
8 吴翌,庄越挺,潘云鹤;视频的检索反馈[J];计算机研究与发展;2001年05期
9 刘文萍;蒋小森;;新的基于综合特征的新闻事件分割方法[J];计算机工程与应用;2009年31期
10 吴玲达;文军;陈丹雯;袁志民;;新闻视频故事单元关联分析技术研究综述[J];计算机科学;2010年06期
相关博士学位论文 前7条
1 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
2 冯哲;基于内容的视频检索中的音频处理[D];复旦大学;2004年
3 刘桂清;视频摘要技术的研究与实现[D];国防科学技术大学;2004年
4 陈剑峗;体育视频语义内容分析技术研究[D];国防科学技术大学;2005年
5 林奕琳;基于语音信号的情感识别研究[D];华南理工大学;2006年
6 孙凯;面向观众的电影情感内容表示与识别方法研究[D];华中科技大学;2009年
7 赵腊生;语音情感特征提取与识别方法研究[D];大连理工大学;2010年
相关硕士学位论文 前2条
1 周洁;语音信号中情感信息的分析和处理研究[D];东南大学;2005年
2 薛琛璋;视频关键帧提取技术及其在舆情分析中的应用[D];北京交通大学;2009年
,
本文编号:
2330297
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2330297.html