基于“实体—描述—效用”模型的新闻视频摘要技术研究
发布时间:2020-05-16 04:09
【摘要】:情报战是打赢未来高技术局部战争的关键之一。视频情报作为一种常见而重要的情报形式,越来越受到相关研究人员和决策者的关注。但是,视频数据线性的、非结构化的数据形式使得视频浏览的效率非常低下。而应用视频摘要技术则可以缩减视频的数据量,提高检索效率,节省浏览时间,对基于视频的情报分析以及视频信息的检索和管理都具有重要意义。 通过研究多种视频摘要算法,本文总结了现有算法的一般流程,即“视频切分—内容提取—重要度评判—摘要合成”,并发现“缺乏一个一般性的指导模型,以及缺乏稳定的中间信息载体”是现有算法的普遍缺陷。针对解决上述问题,本文围绕着如何构建了一个一般性的自动视频摘要模型,以及如何基于此模型实现一个多层次的新闻视频摘要系统这两个方面来展开研究: 1、提出了用于视频摘要的一般性的概念模型,即:“实体—描述—效用”模型,该模型把“实体”作为摘要的基本单元,通过对实体进行描述,获得实体的“效用”,以效用值为基本依据来生成摘要。 2、基于“实体—描述—效用”模型的思想,首先研究了实体切分技术,然后,着重分析了由“实体”到“描述”的过程,设计并实现了一个实体描述体系,将其作为视频内容抽取结果的交流平台。 3、构造了基于描述的效用函数,实现了由“描述”到“效用”的转化。并以效用函数为基本依据,设计了基于可变效用阈值的摘要方法,充分考虑用户的不同偏好,分析了故事板和缩略视频两种形式的新闻故事摘要各自的生成策略。 4、分析了现有的新闻专题摘要形式和方法,提出了两种新的可视化新闻专题摘要形式,并对基于这两种摘要形式的新闻专题分析进行了探讨; 5、设计并实现了一个包含新闻故事摘要和新闻专题摘要的多层次的新闻视频摘要系统,实验表明,该模型具有良好的灵活性和可扩充性,用户对摘要结果的满意度较高。
【图文】:
8(4.4)其中,爪I’‘』代表该镜头的人脸重要度,N代表镜头的总帧数,A、表示第k帧中人脸白勺面积,搜。tI]*,表示帧的面积,,粤表示位置权重,其具体值女口图4一1(b)艺所示。兴3门24门25/12图4一l人脸位置与权重如图4一1(b),我们依据经验将一幅图像垂直方向三等分,水平方向从上至下划为3/12、4/12、5/12三份,并对分成的9块分别赋以权值。9块区域中,正中的一块权值最高,因为这里一般是观众目光的焦点;其次是中部的左右两块,这里出现的人脸对观众的吸引力稍差,最后是上下和四角,一般重要的人物很少出现在这些角落。由上面的重要度公式可以看出,不/tl。。[0
同时尊重用户的个性化需求,我们设计了一个系统预设与用户调整相结合的个性化偏好获取系统。如图5一1所示是系统中的用户偏好调节器。系统初始时对每个描述子赋予了一定的权值,而用户可以依据自己的偏好进行调整。图5一l用户偏好调节器第39页
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:E87
本文编号:2666151
【图文】:
8(4.4)其中,爪I’‘』代表该镜头的人脸重要度,N代表镜头的总帧数,A、表示第k帧中人脸白勺面积,搜。tI]*,表示帧的面积,,粤表示位置权重,其具体值女口图4一1(b)艺所示。兴3门24门25/12图4一l人脸位置与权重如图4一1(b),我们依据经验将一幅图像垂直方向三等分,水平方向从上至下划为3/12、4/12、5/12三份,并对分成的9块分别赋以权值。9块区域中,正中的一块权值最高,因为这里一般是观众目光的焦点;其次是中部的左右两块,这里出现的人脸对观众的吸引力稍差,最后是上下和四角,一般重要的人物很少出现在这些角落。由上面的重要度公式可以看出,不/tl。。[0
同时尊重用户的个性化需求,我们设计了一个系统预设与用户调整相结合的个性化偏好获取系统。如图5一1所示是系统中的用户偏好调节器。系统初始时对每个描述子赋予了一定的权值,而用户可以依据自己的偏好进行调整。图5一l用户偏好调节器第39页
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:E87
【引证文献】
相关期刊论文 前1条
1 吴倩;史萍;;视频摘要技术浅析[J];中国传媒大学学报(自然科学版);2008年02期
本文编号:2666151
本文链接:https://www.wllwen.com/shekelunwen/renwuzj/2666151.html