海量网络视频快速检索关键技术研究
发布时间:2024-02-28 20:58
随着计算机网络和数字多媒体技术的发展,互联网视频应用日益普及,网络视频的数量急剧膨胀,如何有效的发现、检索和处理庞大的网络视频数据已成为研究领域和工业界中亟待研究和解决的问题。 目前互联网视频检索主要存在的问题包括:(1)检索依赖于网络视频的标题、描述文本等信息,视频信息的索引不完全,文本描述信息不准确,从而影响检索的结果;(2)检索过程中没有充分分析和利用视频的视觉信息,使得检索结果存在视觉内容上的重复,与人们的预期存在偏差;(3)在处理海量网络视频数据时,传统的串行方法在性能上不能满足实用的要求。针对这几个问题,本论文的主要研究工作和创新点如下: 1.提出了基于语义结构描述的视频网页识别和信息抽取方法。 针对基于文本的视频检索系统,着重研究互联网视频页面的识别方法以及视频网页文本的抽取算法。首先,提出了基于语义区域表示的视频网页描述方法,以语义区域描述视频网页的结构,然后进一步提出面向语义结构的网页匹配算法,并将算法应用于视频页面的识别和视频描述文本的抽取,有效的提高了视频网页内容识别和抽取的准确性,算法的F值度量超过0.85。 2.提出了结合SIFT特征匹配及时序特征的视频相似度度量方法。 针对传统的视频相似度度量方法存在的准确率不高的问题,本文提出了结合SIFT特征匹配及时序特征的视频相似度度量方法。首先通过SIFT特征进行视频帧的匹配,并通过LSH哈希优化了匹配的效率,提高了匹配的准确率。然后采用RANSAC算法对匹配帧序列进行处理,剔除离群的噪声信息,充分挖掘视频帧之间的相关性,有效地结合了视频帧序列的时序信息,提高了视频相似度度量的准确率,并有效的完成视频片段的相似性检测和消重。在标准数据集的测试中,相似性检测的准确率和召回率均达到90%以上。 3.研究了采用仿射传播聚类算法对视频检索结果优化方法。 视频的检索结果中通常存在大量的相同或者相似的结果,从而影响检索结果的质量和用户的检索体验。本文针对这一问题提出了基于仿射传播(Affinity Propagation)聚类的视频检索结果优化方法。首先依据视频的相似度模型,计算检索结果中的视频之间的相似度,构造相似度矩阵;然后通过仿射传播聚类算法,依据视频之间的相似度矩阵对视频片段进行聚类,将在内容上相似或者相同的视频进行归类,平均聚类准确率为0.83,有效地改善了视频检索结果的质量,并完成检索结果的优化。 4.提出了基于Map/Reduce的分布式海量视频片段相似度计算方法。 视频数据的特征复杂使得视频相似度度量算法在处理大规模视频数据时存在性能瓶颈,本文针对这一问题首先提出了一种面向海量视频相似度计算的视频特征表示方法,该方法借鉴了信息论的模型以及文本数据相似度的计算方法。在特征描述的基础上,提出了基于Map/Reduce架构的视频相似度计算方法,将视频片段相似度计算的任务进行分解,并通过分布式的框架进行处理,有效地提高了视频相似度的计算效率,并且具有较高的可扩展性。 上述方法已应用于国家863项目“结合语义的视频网站自动发现与分析评估服务”课题中的视频片段聚类与视频相关性检索,并将应用于国家科技支撑计划“支持跨区域、多运营商的新一代广播电视服务系统”的“增强型新闻点播服务”中。
【学位级别】:博士
【页数】:124
【部分图文】:
GGGoogleS一tesss136.4699993999YYYah00!S甘tesss51464448.555CCC日51扭erad份eee41,210005333「「OXIntefa由馆Me山aaa40,457777222HHHUIUUU38,4455523万万功功日eomD,gj栩栩38.009999555MMMICf0SOtt象tesss36.1099913666FFFAC仁BOOKCOMMM34.214445222VVVeVOOO32,357777000八八OLLLCCC30,809997.999图1.22010年1月美国在线视频浏览情况2国内,仅2009年4月份,国内主要视频分享网站的有效浏览小时。整个2009年度,国内视频分享服务月度覆盖人数从1长至12月份的2.1亿人,增长率达32.4%,并且呈现持续增长之。
第2章相关技术研究与背景接,当且仅当函数节点依赖与变量节点时才有它们之间的边作为连接。如图2.7A所示,它包含了从函数节点发送到变量节点的消息和从变量节点到函数节点的消息。鞍鞍鞍鞍鞍鞍囊 囊囊囊囊黔黔黔瞬瞬 瞬烈 烈...沂‘裸日 日少j政JJJ迷迷羲 羲到 到图 2.7AP算法的因子图表示从c,到氏(c)的消息包含N个实数,并且表示为Pi。、(力,如图2.7B,通过把这个N个实数规约到一个实数,使得AP算法成为一个有效的基于消息传递的算法,。从氏(c)到c
第2章相关技术研究与背景图2.11是具体的M即 /Reduce系统的执行流程(文献「62])、】)。丹。*k/口必,‘.(2)‘、褪卯rod必‘孙l户J.-.口月.,,一黑雳二下竺、、‘、、_‘、入‘5)忆叮旧.亡份adW改ker要气/蕊赢户丫理已竺wor晚r黑王受}州…骊{塑蝉洲workerIllPut nlesMap户公eIrltenr一 ediatenles(onl沉 aldisks)Redu沈Pha灭oulPut川es图2.11分布式Map/Reduee的执行流程 MaP/Reduce被大量的应用于Google的各种计算任务中,以文本中的词频统计为例,MaP的过程如算法2.5所示:算算法2.5词频统计的M即流程 程 mmmaP(StringinPutkey, StringinPutvalue)::: ////inPu七 key:doeumentnameee ////inPu七 value:doeumenteontentsss ffforeaChwordwininpu七 _value::: EEE讯i七工n七ermediate(w,”1” );;;词频统计的Reduce的过程如算法2.6:算算法2.6词频统计的Reduce流程 程rrreduCe(S七 ringOu七pu七_key,工七era七。 rin七ermedia七e_va工ue
麟麟黝呱 呱图3.1典型的视频播放页面的结构化表示图3.1为一个典型的视频播放页面,通过结构化语义块的表示方法,将其转换为DOM树结构,同时,页面的1、2、3等标记的语义区域在DOM树上分别对应于子树表示。通过这种语义结构化的表示,可以通过进一步的算法来处理文档内容,以完成视频播放网页的识别和视频文本信息的抽取的工作。3.2基于语义结构化的视频网页识别与内容抽取
本文编号:169675
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/169675.html