视频概念检测中的领域自适应和语义关联研究
本文关键词:视频概念检测中的领域自适应和语义关联研究 出处:《北京交通大学》2016年博士论文 论文类型:学位论文
更多相关文章: 视频标注 概念检测 领域自适应 多特征融合 概念关联 语义模型
【摘要】:当今社会,智能设备正以前所未有的速度进行普及,日渐完善的互联网和移动网络将来自全世界的信息汇总和连接,人们从信息的接受者逐渐变成了信息的创造者和传播者。视频作为一种信息的常见载体,融合了图像、时序、音频等多种特征,具有直观生动的特点,被广泛地应用。然而视频中所包含的复杂的语义层级信息对高效的管理和准确的检索提出了更为严苛的挑战。在视频人工标注过于昂贵的情况下,为了从视频内容中直接读取出其中包含的物体、人物、场景等语义层概念,发展出了基于内容的视频概念检测技术。然而,当前的视频概念检测技术尚且面临着种种困难,还无法很好地在实际中得到应用。比如训练库与测试库不同领域之间广泛存在的样本分布差异导致检测器的性能下降、找寻视频中多种特征之间灵活高效的融合方式、低层特征与高层特征之间存在的“语义鸿沟”等问题。本文以上述三方面中的研究难点为出发点,对视频概念检测中的特征层领域自适应问题、多特征融合中的领域自适应问题以及视频概念间的语义关联进行了探讨和创新,主要取得的成果如下:(1)针对目前特征层的不同领域间样本分布差异的问题,本文基于Adaboost提出了领域自适应boosting算法(DAB)。它主要解决的是当前TrAdaBoost算法中存在的目标领域(测试库)与源领域(训练库)数据分配不合理的问题,分为两个主要步骤:首先对源领域的数据在特征空间内进行无监督分类;然后在迭代训练中,将目标领域验证集中选择出的样本映射到已分类的源领域特征空间中,匹配出一定数量的源领域样本。最后,两个领域选择出的数据共同进行弱分类器的训练。作为TrAdaBoost算法的一种改进型算法,DAB算法能够很好地解决大规模领域定义和小尺寸验证集的情况。DAB算法有两个主要优点:在训练中能够突出目标领域数据的重要性,在实验中获得了更好性能表现;由于不需要对源领域的数据进行判别和权值计算,因而减小了计算量。(2)针对当前多特征融合研究中的领域自适应能力缺失的问题,本文提出了领域自适应的线性融合方法(DALC).它是一种后期融合方法,基于多特征分类器的输出分值进行融合。该算法以线性融合模型(LC)为基础,通过分析源领域和目标领域之间的差异,来自适应更新LC模型的融合参数。它的原理是找寻领域样本与LC融合参数之间的关联关系,利用源领域中已经建立的关联关系去指导目标领域的关联关系,通过优化搜索来找寻更新后的融合参数,使得两个领域中存在的关联关系距离最小。DALC模型是一种通用的非监督式方法,不需要训练,有着很快的自适应速度。与当前一些没有考虑领域自适应的多特征融合方法相比,有着更好的融合性能。(3)针对视频概念间的语义关联问题,本文提出了基于节点平衡(NE)的概念关联模型,它与DALC模型共同构成了一个两级语义模型。该方法以物理模型为基础,将概念之间的关联性用物理性的引力和斥力进行建模,而将一个个镜头-概念对看作是物理节点,它们的分值则是它们所处的位置。对不同类别的概念关联方式,可以定义不同种类的力,它们可以共同作用在一个节点之上,从而达到使用多种概念关联共同作用的结果。与现有的方法相比,它可以使用多种概念间的关联关系同时进行构建复杂的语义关系,文中使用了三种关联:共存关联、层级关联和时序关联。它是一种启发式模型,对概念的关联过程以模拟人的先验知识为主导,因此具有直观性的特点。此外,它有着简洁的关联方程,求解过程快速;并且可以根据先验知识或训练数据的有无,应用监督式或无监督式的关联参数。
[Abstract]:In the present society , the intelligent equipment is popularized in unprecedented speed , and the increasingly perfect Internet and mobile network bring about information summarization and connection from the whole world . In this paper , a concept association model based on node balance ( NE ) is proposed based on the correlation between the source domain and the target field .
【学位授予单位】:北京交通大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 杨富强;爱维德在中国拓展新视频领域[J];今日电子;1996年04期
2 王缦缦;爱维德技术公司在中国拓展新视频领域[J];现代电信科技;1996年04期
3 陈永东;;2010年网络视频领域发展趋势[J];软件工程师;2010年Z1期
4 苏岩;;微视频发展历史研究[J];软件导刊(教育技术);2011年11期
5 瞬雨;;视频突破:聚合的开放性意义[J];软件工程师;2009年06期
6 吴勇毅;;以创新破困局——2012视频网业之嬗变[J];软件工程师;2012年05期
7 李萧然;;三视频巨头弃成见结盟 二三线阵营面临生死抉择[J];IT时代周刊;2012年10期
8 贾志宏 ,康文萱;1993年《国际音视频》杂志视频大奖赛[J];今日电子;1994年01期
9 莫黎,方骅;多媒体技术在视频领域中的应用[J];计算机与数字工程;2002年05期
10 ;2008年市场规模超15亿 网络视频业格局渐明[J];中国传媒科技;2008年01期
相关重要报纸文章 前10条
1 西平;亿万财富百日造 网络视频的现实抉择[N];中国经济时报;2006年
2 薛娟;网络视频:烧钱不赚钱?[N];中国经济时报;2007年
3 张牧涵;网络视频挑战电视[N];市场报;2007年
4 张亚萍;“新规”加速视频业健康发展[N];光明日报;2009年
5 本报记者 黄智军;第一视频 出击微视频 打造明星团队[N];计算机世界;2010年
6 本报记者 刘燕;第一视频主推微视频[N];科技日报;2010年
7 实习记者 俞悦;网络视频试图联姻传统行业 基因成本众多因素左右其抉择[N];中国计算机报;2008年
8 商报实习记者 魏蔚;新浪推微视频赶搭行业末班车[N];北京商报;2011年
9 本报记者 王荣;激动网首推视频云计划[N];中国证券报;2011年
10 本报记者 任晓宁;微视频一路升温:产业前景日见清晰[N];中国新闻出版报;2012年
相关博士学位论文 前10条
1 赵敏丞;无线网络中视频跨层传输关键技术研究[D];北京邮电大学;2015年
2 耿杰;视频概念检测中的领域自适应和语义关联研究[D];北京交通大学;2016年
3 刘桂清;视频摘要技术的研究与实现[D];国防科学技术大学;2004年
4 梅涛;家用视频内容分析方法研究[D];中国科学技术大学;2006年
5 宋彦;视频语义标注方法和理论的研究[D];中国科学技术大学;2006年
6 付畅俭;基于内容的视频结构挖掘方法研究[D];国防科学技术大学;2008年
7 白亮;本体支持的视频情报分析方法与技术研究[D];国防科学技术大学;2008年
8 罗青山;面向视频挖掘的视觉内容分析[D];上海交通大学;2009年
9 张静;视频信息检索研究[D];复旦大学;2006年
10 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
相关硕士学位论文 前10条
1 王嫣然;视频的美学和有趣性计算角度[D];复旦大学;2014年
2 陈倬;3D视频c\索引擎中3D视频识别和聚类的研究[D];电子科技大学;2014年
3 范玉宪;视频监控中人体跟踪的研究与实现[D];浙江工业大学;2015年
4 黄吉羊;基于视频非接触技术的身份识别、追踪及异常预警[D];浙江大学;2016年
5 姜丽秋;视频网站传播模式及发展策略研究[D];湖南师范大学;2015年
6 李亚;解析新浪视频的成功运作[D];华中科技大学;2009年
7 陈锦星;视频监控云系统架构及运营模式的研究[D];大连理工大学;2013年
8 李春亮;广告视频探测技术研究[D];国防科学技术大学;2004年
9 郭婧;中国视频网站现状探析[D];上海交通大学;2011年
10 汪芬;压缩域内视频切换检测的研究[D];北京邮电大学;2006年
,本文编号:1362310
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1362310.html