大规模新闻网络视频话题检测与跟踪技术研究
发布时间:2020-02-03 15:09
【摘要】:针对当下网络视频数量激增,在线访问量巨大,现有搜索引擎不便于用户浏览、搜索并快速掌握新闻事件演化发展的缺陷,本文以著名的在线视频分享与社交网站YouTube作为代表性数据源,从2006年至2009年的四年间选取了22个全球热点新闻话题,总共获得19,972个视频作为主要研究对象,研究了基于网络视频搜索结果的新闻事件检测、事件关系挖掘和话题事件结构的建立。同时从文本特征分析和视觉特征分析两方面入手,结合文本和视觉的各自优势,提出了新闻网络视频突发事件挖掘和结构生成的系统技术框架。具体地,首先根据视频数量随用户上传时间的分布检测出话题的事件突发时间区间(Bursty Period),从而滤除与话题相关度不大的噪声视频。然后,对于筛选出的视频分文本和视觉两方面分别进行特征分析和挖掘,得到文本和视觉上各自的候选事件。在这一过程中,我们深入研究了共存性和特征轨迹两大特征模式分析方法在文本和视觉近似重复帧上的应用。接下来,内容相同或相似的文本和视觉事件通过一种二分图的方法被融合到一起。事件与事件之间的近似度被计算出来,由此又能将事件相互关联在一起,并映射到时间轴上,最终生成话题的事件关系结构图,使网络用户能够直观快速地了解新闻话题的主要事件及其发展演化过程。 本文主要的研究内容和贡献如下: 第一,提出了新闻网络视频突发事件挖掘和话题结构生成的一种新系统框架,该框架将细粒度的视觉特征和粗粒度的文本特征结合到一起,提升了事件聚类的性能; 第二,考虑到新闻网络视频区别于传统新闻视频,文本内容稀疏且通常包含大量噪声,本研究利用近似重复帧(Near-Duplicate Keyframe, NDK),首次引入NDK序列生成的视觉特征轨迹作为事件挖掘的重要技术手段,并同文本特征结合起来; 第三,探索了共存性(Co-occurrence)和特征轨迹(Feature Trajectory)在视觉近似重复帧上的应用,采用一种基于约束的聚类方法将两者的优势结合起来; 第四,借助新系统框架,提出了一种话题事件结构生成算法,该算法将事件映射到时间轴上并展现出事件之间的联系,获得了较好的效果,也启发出一种新颖的视频浏览用户交互模式。 实验结果表明,本文在视觉方面提出的事件检测方法取得了较高的精确度,并且文本和视觉相融合也较好地保留了两者的优势。由此生成的话题事件结构图直观地展现了新闻话题的主要事件及其发展脉络。
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP393.09
本文编号:2576052
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP393.09
【参考文献】
相关期刊论文 前1条
1 钱刚,曾贵华;典型视频镜头分割方法的比较[J];计算机工程与应用;2004年32期
,本文编号:2576052
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2576052.html