用于视频内容标注的知识迁移方法
发布时间:2017-07-01 16:17
本文关键词:用于视频内容标注的知识迁移方法,由笔耕文化传播整理发布。
【摘要】:现在人们经常拍摄视频来记录生活中的片段。对这些普通用户拍摄的视频自动地进行内容标注已成为计算机视觉领域的一个重要问题。视频内容标注可以让用户更加方便的对视频进行管理和检索,也可以应用于智能视频监控。用户拍摄的视频内容各种各样,而且视频画面中也会发生抖动和遮挡。同一类视频之间会有很大的差异,这使得视频内容标注成为一个非常有挑战性的问题。传统的视频标注方法需要人工收集和标注大量的训练样本,才能取得较好的效果。然而,收集和标注训练样是一项非常费时费力的工作。当仅有少量标注的训练样本时,传统的标注方法很难取得较好的泛化能力和鲁棒性。近年来出现的迁移学习(transfer learning)方法能够处理这个问题。迁移学习可以利用不同但相关数据域(domain)中的数据来学习感兴趣数据域上的分类器。本文主要探讨如何利用互联网上的视频(源域,source domain)来对用户视频(目标域,target domain)中的事件进行标注。视频搜索引擎已经越来越成熟,可以借助它们从互联网上得到大量的与检索关键字相关的视频。但这些视频一般都经过压缩,画面质量比用户视频低很多,而且检索到的一些视频与检索关键字并不相关,导致网络视频和用户视频之间存在着很大的差异。所以直接使用网络视频来训练并不能得到很好的用户视频分类器。本文提出一种多组领域适应(Multi-group Adaptation)的方法,将网络视频根据语义划分成不同组,为每组设置不同的权重系数,来减轻不相关的网络视频在训练过程中产生的负面影响。当存在多个事件类别时,很多方法采用“一对其余”(one-vs-the-rest)的分类策略,从而出现训练样本不平衡和分类器输出尺度不统一的问题。本文还提出了一种多类领域适应(Multi-class Domain Adaptation)方法,可以克服“一对其余”带来的问题。实验结果表明,本文提出的基于迁移学习的方法能有效地利用网络视频对用户视频中的事件进行标注,标注模型的效果相比于相关已有模型有显著的提高。
【关键词】:事件识别 迁移学习 视频标注 领域适应
【学位授予单位】:北京理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 摘要5-6
- Abstract6-10
- 第1章 绪论10-14
- 1.1 研究意义10-11
- 1.2 研究内容11-12
- 1.3 论文结构12-14
- 第2章 研究现状14-24
- 2.1 引言14
- 2.2 基于内容的视频标注14-18
- 2.2.1 视频特征提取14-17
- 2.2.2 视频事件标注17-18
- 2.3 迁移学习18-24
- 2.3.1 特征表示的迁移19-20
- 2.3.2 分类器的迁移20-24
- 第3章 多组领域适应的视频标注24-38
- 3.1 引言24-25
- 3.2 相关工作25-26
- 3.3 多组领域适应的视频标注方法26-31
- 3.3.1 问题描述26-27
- 3.3.2 多组领域权重学习算法27-28
- 3.3.3 多组领域适应方法28-29
- 3.3.4 模型求解方法29-31
- 3.4 实验31-37
- 3.4.1 数据库31-33
- 3.4.2 实验设置33-34
- 3.4.3 实验结果34-37
- 3.5 小结37-38
- 第4章 多类知识迁移的视频标注38-50
- 4.1 引言38-39
- 4.2 相关工作39
- 4.3 视频表示39-40
- 4.4 基于多类分类器的知识迁移方法40-43
- 4.4.1 基于相似性的正则项40-43
- 4.4.2 迁移模型43
- 4.5 实验43-48
- 4.5.1 数据库44
- 4.5.2 实验设置44-45
- 4.5.3 实验结果45-48
- 4.6 小结48-50
- 结论50-53
- 工作总结50-51
- 未来展望51-53
- 参考文献53-59
- 攻读学位期间发表论文与研究成果清单59-60
- 致谢60
【共引文献】
中国博士学位论文全文数据库 前2条
1 冯杰;基于H.264压缩域的视频分割与特征提取方法研究[D];浙江大学;2009年
2 刘浏;基于内容的重排列视频检索技术研究[D];上海交通大学;2013年
中国硕士学位论文全文数据库 前6条
1 徐丹;基于内容的视频检索系统研究[D];武汉理工大学;2007年
2 蔡奕奕;基于运动特征的视频检索技术研究[D];广西大学;2008年
3 余琛;面向互联网的视频监控系统的设计与实现[D];西安电子科技大学;2009年
4 冯自星;基于TS模型的视频匹配方法研究与分析[D];广西大学;2012年
5 董琳娜;基于多模态特征的视频语义镜头标注[D];西安电子科技大学;2013年
6 王万;面向无线失真网络的视频质量无参评估[D];石家庄铁道大学;2014年
本文关键词:用于视频内容标注的知识迁移方法,,由笔耕文化传播整理发布。
本文编号:506627
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/506627.html