基于视频深度学习的人物行为分析与社交关系识别
本文选题:人物行为语义 切入点:社交关系 出处:《南京邮电大学》2017年硕士论文 论文类型:学位论文
【摘要】:识别视频中人物行为与社交关系是理解视频语义的重要任务,其主要难点在于如何通过运用深度学习等算法来分析和整合与人物行为相关的视频语义线索。近年来传统的深度学习算法在简单静态图片识别方面取得了突出成就,但是仍不能满足视频中复杂的人物行为与社交关系识别要求。本学位论文以识别视频中的人物行为语义与社交关系为研究目标,首先提出一种基于长短期记忆(LSTM)模型的语义识别算法来识别视频中人物行为,再通过一种基于无向有权图的节点聚类算法来完成视频中人物社交分组,最后通过部分标记因子图模型(SPLP-FGM)来推断视频中人物的社交关系。此外,本文在微软视频描述语料、电影描述的语料库两个数据集上进行人物行为语义识别实验,在电视剧Friends数据集上进行人物社交关系识别实验。实验结果表明,本文提出的基于LSTM模型的语义识别算法能够高效和全面地识别视频中人物的行为语义,部分标记因子图模型能够有效地识别视频中人物之间的社交关系。本文的工作创新主要体现在以下三个方面:(1)利用卷积神经网络并行地抽取每个视频场景中的人物身份、人物动作和上下文等三个方面的中层语义特征,通过两层循环神经网络来融合这三个方面的语义信息来完成视频中人物行为语义的识别;(2)将视频中的人物社交映射成无向有权图,通过一种基于无向有权图的节点聚类算法来完成视频中人物的社交分组;(3)在完成视频中人物的社交分组和行为语义识别的基础上,通过构建和学习部分标记因子图模型来推断视频中所有的未知人物社交关系。
[Abstract]:It is an important task to understand the meaning of video to identify the relationship between the behavior and social relationship of the characters in the video. The main difficulty lies in how to analyze and integrate the video semantic clues related to the behavior of characters by using deep learning algorithms. In recent years, traditional depth learning algorithms have made outstanding achievements in simple static image recognition. However, it still can not meet the requirements of complex character behavior and social relationship recognition in video. This dissertation aims to identify the semantic and social relationship of character behavior in video. Firstly, a semantic recognition algorithm based on LSTM (long and short memory) model is proposed to identify the behavior of characters in video. Then, a node clustering algorithm based on undirected weighted graph is proposed to realize the social grouping of characters in video. Finally, the social relationship of the characters in the video is inferred by the partial tagging factor graph model (SPLP-FGM). In addition, the experiment of character behavior semantic recognition is carried out on the two data sets of Microsoft video description corpus and movie description corpus. The experiment of character social relationship recognition on TV series Friends dataset shows that the proposed semantic recognition algorithm based on LSTM model can effectively and comprehensively recognize the behavioral semantics of the characters in the video. Part of the tagging factor graph model can effectively identify the social relationship between the characters in the video. The work innovation of this paper is mainly reflected in the following three aspects: 1) using convolution neural network to extract the identity of the characters in each video scene in parallel. The middle semantic features of character action and context, The two-layer cyclic neural network is used to fuse the semantic information of these three aspects to realize the semantic recognition of the behavior of the characters in the video. (2) the social interaction of the characters in the video is mapped into an undirected weighted graph. In this paper, a node clustering algorithm based on undirected weighted graph is used to realize the social grouping of the characters in the video, which is based on the recognition of the social grouping and behavioral semantics of the characters in the video. By constructing and learning partial marker factor graph model, we infer the social relationship of all unknown characters in the video.
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 ;四款微视频服务介绍:微视频时代即将到来?[J];硅谷;2011年10期
2 杨富强;爱维德在中国拓展新视频领域[J];今日电子;1996年04期
3 王缦缦;爱维德技术公司在中国拓展新视频领域[J];现代电信科技;1996年04期
4 陈永东;;2010年网络视频领域发展趋势[J];软件工程师;2010年Z1期
5 苏岩;;微视频发展历史研究[J];软件导刊(教育技术);2011年11期
6 瞬雨;;视频突破:聚合的开放性意义[J];软件工程师;2009年06期
7 吴勇毅;;以创新破困局——2012视频网业之嬗变[J];软件工程师;2012年05期
8 李萧然;;三视频巨头弃成见结盟 二三线阵营面临生死抉择[J];IT时代周刊;2012年10期
9 贾志宏 ,康文萱;1993年《国际音视频》杂志视频大奖赛[J];今日电子;1994年01期
10 莫黎,方骅;多媒体技术在视频领域中的应用[J];计算机与数字工程;2002年05期
相关会议论文 前10条
1 杨黎娟;秦荣;;浅谈研究生学位论文档案管理及开发利用[A];陕西省档案学会第八次档案学术讨论会论文选辑[C];2004年
2 龚乐年;;刍议影响研究生业务培养质量的几个原因[A];第二届全国高校电气工程及其自动化专业教学改革研讨会论文集(下册)[C];2004年
3 蔡妙花;曹春;赵乃良;;优化管理提升研究生培养质量的探索和实践[A];电子高等教育学会2008年学术年会论文集[C];2008年
4 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
5 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
6 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
7 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
10 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
相关重要报纸文章 前10条
1 西平;亿万财富百日造 网络视频的现实抉择[N];中国经济时报;2006年
2 薛娟;网络视频:烧钱不赚钱?[N];中国经济时报;2007年
3 张牧涵;网络视频挑战电视[N];市场报;2007年
4 张亚萍;“新规”加速视频业健康发展[N];光明日报;2009年
5 本报记者 黄智军;第一视频 出击微视频 打造明星团队[N];计算机世界;2010年
6 本报记者 刘燕;第一视频主推微视频[N];科技日报;2010年
7 实习记者 俞悦;网络视频试图联姻传统行业 基因成本众多因素左右其抉择[N];中国计算机报;2008年
8 商报实习记者 魏蔚;新浪推微视频赶搭行业末班车[N];北京商报;2011年
9 本报记者 王荣;激动网首推视频云计划[N];中国证券报;2011年
10 本报记者 任晓宁;微视频一路升温:产业前景日见清晰[N];中国新闻出版报;2012年
相关博士学位论文 前10条
1 赵敏丞;无线网络中视频跨层传输关键技术研究[D];北京邮电大学;2015年
2 耿杰;视频概念检测中的领域自适应和语义关联研究[D];北京交通大学;2016年
3 刘桂清;视频摘要技术的研究与实现[D];国防科学技术大学;2004年
4 梅涛;家用视频内容分析方法研究[D];中国科学技术大学;2006年
5 宋彦;视频语义标注方法和理论的研究[D];中国科学技术大学;2006年
6 付畅俭;基于内容的视频结构挖掘方法研究[D];国防科学技术大学;2008年
7 于翔;国家可持续发展实验区能力评估及示范效应实证研究[D];西南交通大学;2015年
8 Akanand Singh;[D];重庆医科大学;2016年
9 AJAY KUMAR MISHRA;[D];重庆医科大学;2016年
10 PRIYANKA SHUKLA;[D];重庆医科大学;2016年
相关硕士学位论文 前10条
1 高翔;基于视频深度学习的人物行为分析与社交关系识别[D];南京邮电大学;2017年
2 王俊;随机步长无向环网通信延迟的研究[D];安徽工业大学;2017年
3 王嫣然;视频的美学和有趣性计算角度[D];复旦大学;2014年
4 陈倬;3D视频c\索引擎中3D视频识别和聚类的研究[D];电子科技大学;2014年
5 范玉宪;视频监控中人体跟踪的研究与实现[D];浙江工业大学;2015年
6 姜丽秋;视频网站传播模式及发展策略研究[D];湖南师范大学;2015年
7 张艳茹;视频网站成本费用控制分析[D];首都经济贸易大学;2016年
8 尹路通;基于隐语义模型的网络视频推荐系统研究[D];新疆大学;2016年
9 王浩宇;特效在微视频领域的应用研究[D];上海师范大学;2016年
10 任晓琴;鬼畜视频的“热传播”现象研究[D];四川师范大学;2016年
,本文编号:1565196
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1565196.html