当前位置:主页 > 文艺论文 > 广告艺术论文 >

基于内容的视频片段检索技术研究

发布时间:2018-09-09 14:19
【摘要】: 近年来,随着视频信息资源的日益丰富,从大量的视频数据中检索感兴趣的视频片段已经成为目前视频检索研究的热点。人们期望在不久的将来像文本检索那样,由用户向系统提交查询的视频内容,,系统自动地返回符合查询需要的结果。在这种背景下,基于内容的视频检索应运而生,它综合了图像处理、模式识别、计算机视觉、图像理解等领域的知识,具有广阔的应用前景。 本文以广告类视频、球拍类体育比赛视频和新闻视频为研究对象,主要研究了这三类视频的片段检索方法。 提出了一种新的广告类视频片段检索方法。在定义查询片段镜头的相似镜头集的基础上,给出了两个片段一一对应相似镜头数目的计算方法,以排除伪相似片段,进而定义了片段的匹配函数;采用滑动镜头窗从连续的视频流中自动分割出多个相似片段;将相似镜头集映射为相似镜头矩阵,利用矩阵的特性来计算影响片段相似程度的各个因子,建立了相似片段的排序模型。与同样功能的其他方法相比,在确保较高的检索精度的前提下,提高了检索速度。 融合视觉特征、运动特征和音频特征,提出了一种球拍类体育比赛视频的Rally精彩片段检索方法。提出了一种基于运动特征和主颜色特征的自动选择Global View Shots类的参考关键帧的方法,以便将镜头划分为Global View Shots类和Non-Global View Shots类;SVM用于识别镜头的重要音频类型;将音频信息应用到镜头类,建立了感兴趣事件检测的相应规则;利用回放的Rally片段和Rally精彩程度模型,从球拍类比赛中检索出符合多数人心理的Rally精彩片段。 提出了一种基于视觉特征和语义信息的新闻视频片段检索方法。提出了一种新闻视频主题字幕文本检测方法,进而讨论了一种通过主题字幕文本和静音片段进行新闻视频故事分段的方法;基于低层视觉特征和主题字幕文本获得的语义信息建立了新闻片段的相似度模型,并应用相关反馈技术从新闻节目中检索出最符合用户需求的新闻故事片段。 设计并初步实现了一个基于内容的视频片段检索实验平台,验证了上述片段检索方法的性能。
[Abstract]:In recent years, with the increasing enrichment of video information resources, retrieval of interested video fragments from a large number of video data has become the focus of video retrieval research. It is expected that in the near future, like text retrieval, users will submit the video content of the query to the system, and the system will automatically return the results that meet the needs of the query. In this context, content-based video retrieval emerges as the times require. It integrates the knowledge of image processing, pattern recognition, computer vision, image understanding and so on, and has a broad application prospect. In this paper, the video of advertising, racket sports and news video are taken as the research objects, and the retrieval methods of these three kinds of video fragments are mainly studied. In this paper, a new method of video segment retrieval for advertisement is proposed. Based on the definition of the similar shot set of the query segment shot, the method of calculating the number of similar shots corresponding to the two fragments one by one is given to eliminate the pseudo-similar fragments, and then the matching function of the fragments is defined. The sliding lens window is used to automatically segment several similar fragments from the continuous video stream, and the similar shot set is mapped to the similar lens matrix, and the factors affecting the similarity degree of the segment are calculated by using the properties of the matrix. The sorting model of similar fragments is established. Compared with other methods with the same function, the retrieval speed is improved on the premise of higher retrieval accuracy. Based on visual features, motion features and audio features, a Rally video retrieval method for racket sports competition video is proposed. A method of automatically selecting the reference key frame of Global View Shots class based on motion feature and main color feature is proposed in order to divide the shot into Global View Shots class and Non-Global View Shots class to recognize the important audio type of shot. The audio information is applied to the lens class, and the corresponding rules for detecting interesting events are established. By using the playback Rally fragment and the Rally wonderful degree model, the Rally wonderful fragments which accord with the majority of people's psychology are retrieved from the racket game. This paper presents a method of news video segment retrieval based on visual features and semantic information. In this paper, a method of text detection for news video topic subtitles is proposed, and then a method for news video story segmentation through topic caption text and mute segment is discussed. The similarity model of news segments is established based on the semantic information obtained from low-level visual features and subject subtitles. The relevant feedback technique is applied to retrieve the news story fragments that are most suitable for users' needs. A content-based video segment retrieval experimental platform is designed and implemented, and the performance of the above method is verified.
【学位授予单位】:南京理工大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 边振兴;;WordNet中概念语义相似度IC参数模型研究[J];计算机工程与应用;2011年19期

2 ;[J];;年期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相关会议论文 前4条

1 周学文;郑玉玲;;《元朝秘史》相似人名考[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

2 丁德鑫;曲维光;于丽丽;陈小荷;李惠;;基于词频和语义信息的组合型歧义消解[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

3 包敏娜;华沙宝;;蒙古文扫描识别系统自动校正算法设计[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

4 刘亚军;赵峗;;一种本体驱动的自动答疑系统[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

相关博士学位论文 前3条

1 赵亚琴;基于内容的视频片段检索技术研究[D];南京理工大学;2007年

2 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年

3 赵京雷;汉语动词名物化复合结构的语义解释[D];上海交通大学;2008年

相关硕士学位论文 前10条

1 万鑫;模糊推理在疾病辅助诊断系统中的应用研究[D];湖南大学;2009年

2 郑岩;住宅房地产项目前期策划阶段的价格定位[D];中南大学;2008年

3 李强;基于内容的视频检索研究[D];南京理工大学;2012年

4 马金涛;基于内容的监控视频检索关键技术研究[D];天津大学;2010年

5 孙娟娟;对等网络中的查询机制研究[D];曲阜师范大学;2011年

6 杨巍巍;网络考试系统中关键技术的研究与应用[D];哈尔滨工程大学;2010年

7 孙伟;基于文档复制检测技术的研究与实现[D];辽宁工程技术大学;2010年

8 李红;基于本体的QoS及业务应用研究[D];云南大学;2010年

9 田浩;基于PageRank值的文本相似度改进模型[D];湖北工业大学;2010年

10 肖君德;知识元相似度模型及融合方法研究[D];大连理工大学;2012年



本文编号:2232633

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2232633.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a4f9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com