基于深度学习的视频描述技术研究与应用
【图文】:
逦逡逑图1-1给出了一个视频描述任务的例子。从图中可以看出,该任务的输入是逡逑一段视频片段,目前评测数据中的视频片段长度通常在10秒到20秒之间,输出逡逑则是该视频的描述语句,通常是一个完整的不超过20个单词的英语句子。与视逡逑频分类任务识别出标签类别不同,视频描述任务生成的是一个内容丰富并且满足逡逑语法条件的自然语句。同时与基于一些关键信息进行自然语言生成的任务不同,逡逑视频描述任务直接基于视觉信息进行描述句生成,因此,需要提取视觉信息,例逡逑如识别视频中的物体形态、人物动作和物体之间的关系等。显然,,视频描述任务逡逑需要依托计算机视觉(Computer邋Vison,CV)和自然语言处理(Natural邋Language逡逑Processing,NLP)两个领域理论和技术的共同支撑。因而,开展视频描述领域的逡逑研宄工作,有助于促进多模态信息融合与交互技术的发展,进一步启发和促进其逡逑他多模态任务的研宄,这对于相关学科学术的研宄和探讨具有重要的意义。由于逡逑视频描述技术所具有的巨大应用前景和重要学术价值,促使众多的学者从各自的逡逑领域出发,在不同层面和不同角度开展相关的研究。逡逑
用于生成语言描述句逡逑2015年,Vinyals等人[51]参考机器翻译模型[45],提出一个基于深度神经网络逡逑结构的NIC邋(Neural邋Image邋Caption)模型,用于解决图像描述问题,结构如图1-2逡逑所示。在图的左端,该模型采用AlexNet网络[29]提取图像特征。之后,在右端先逡逑将图像特征输入到长短时记忆网络(Long邋Short-Term邋Memory,邋LSTM)的第一个逡逑单元。然后在第二个时刻输入句子的起始符<START>,之后每个时刻逐次输入逡逑上一个时刻的输出词,预测当前时刻的词,该过程直到预测出句子的结束符逡逑<END>停止,最终输出完整描述句。在图像描述集上评测,结果说明NIC模型逡逑超过了其他描述模型的结果。不同于NIC模型只采用嵌套矩阵建模词表示,Mao逡逑等人[52]使用一个2层的嵌套网络学习词表示。然后使用一个多模态层将文本表逡逑示和视觉信息融合在一起解决图像描述任务。而在2016年,Wang等人[53]采用逡逑一个双向的长短时记忆网络(Bi-directional邋Long邋Short-Term邋Memory
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
【相似文献】
相关期刊论文 前10条
1 康杰;杨达;李永涛;;犯罪描述技术:侦查心理应用研究的前沿[J];中国刑警学院学报;2005年01期
2 刘传虎;不同勘探开发阶段的储层地震描述技术[J];中国石油勘探;2003年02期
3 孙玉芝;;“标准物质描述技术规范研究制定及试点应用”项目通过验收[J];中国计量;2006年06期
4 石砥石,谭俊敏,王大华,范云;地震描述技术在新滩油田储量计算中的应用[J];海洋石油;2002年03期
5 史小平;特高含水期剩余油分布的定量描述技术[J];内蒙古石油化工;2004年01期
6 林淑荣,张明学;精细构造描述技术在油田开发中的应用[J];油气田地面工程;2004年04期
7 张广泉;计算机网络通信协议的一种形式化描述技术[J];重庆师范学院学报(自然科学版);1999年01期
8 胡言微语;;“标准如歌”——标准化之音乐论[J];标准生活;2010年03期
9 卢安,李树东,任怀志;工作描述技术在农村卫技人员培训中的应用[J];实用乡村医生杂志;1996年02期
10 张忠社;郭卫国;;基于路径描述技术的配电能力研究[J];自动化与仪器仪表;2019年05期
相关会议论文 前8条
1 王秀娟;;大庆外围低渗透油藏精细地质描述技术[A];2004第三届油气储层研讨会论文摘要集[C];2004年
2 史永晋;;基于惯性导航系统的海底管道轨迹描述技术研究[A];第十五届中国海洋(岸)工程学术讨论会论文集(上)[C];2011年
3 陈建文;戴春山;龚建明;于常青;符溪;白志琳;徐华宁;高红芳;;中国海域层序地层学环境描述技术[A];2001年全国沉积学大会摘要论文集[C];2001年
4 谷国翠;孙明江;李国栋;姜蕾;;分流河道砂体识别与描述技术研究——以营子街地区沙三上亚段为例[A];中国石油学会2017年物探技术研讨会论文集[C];2017年
5 苑书金;;大牛地气田致密储层地震描述技术的研究和应用[A];中国地球物理学会第二十三届年会论文集[C];2007年
6 王咸彬;;准噶尔盆地腹部隐蔽圈闭识别与描述技术[A];中国地球物理·2009[C];2009年
7 亓校湘;;三角洲前缘相储层定量描述技术及对储层沉积特征的认识[A];2002低渗透油气储层研讨会论文摘要集[C];2002年
8 高平;于正军;张建芝;;断陷湖盆陡坡带砂砾岩扇体地球物理描述技术[A];中国地球物理学会第二十三届年会论文集[C];2007年
相关重要报纸文章 前7条
1 记者 王志田 通讯员 孙加平;“两特低”油藏综合描述技术取得成功[N];中国石油报;2006年
2 通讯员 周小松 刘宪明;采油六厂井震结合搞挖潜[N];大庆日报;2010年
3 路智勇 胜利油田现河采油厂厂长;通过创新实践消灭低效储量[N];中国石化报;2019年
4 王宏伟 周洪波;谨防战术上的“被动锁定”[N];中国国防报;2007年
5 本报记者 吴苡婷;快速精确反应 打造监控产业的新蓝海[N];上海科技报;2013年
6 公安部第三研究所 胡传平 梅林;视频监控如何应对深度应用的挑战[N];人民公安报;2010年
7 于鸿升 记者 栾哲;企校联姻育人才[N];吉林日报;2011年
相关博士学位论文 前1条
1 汪悦;基于深度学习的视频描述技术研究与应用[D];北京邮电大学;2019年
相关硕士学位论文 前7条
1 姜福东;萨中密井网开发区储层综合描述技术研究[D];东北石油大学;2010年
2 韩东妹;汉字字形描述技术研究[D];内蒙古师范大学;2007年
3 张君泉;基于语义Web的服务描述技术研究[D];山东科技大学;2006年
4 张钰;异构网络可编程设备互操作技术研究[D];大连理工大学;2007年
5 李田田;技术路线图在科技奥运中的应用研究[D];河南大学;2007年
6 李金金;基于k曲率的尺度空间描述技术研究[D];苏州大学;2014年
7 严健;TCP/IP协议鲁棒性测试研究[D];华中科技大学;2009年
本文编号:2678223
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2678223.html