当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的排球视频行为识别算法研究

发布时间:2023-11-12 16:21
  人类行为识别是计算机视觉中一个重要的主题,行为识别既包括单人执行一系列动作以完成某项任务,也包括许多人分散在一个大的空间里,共同努力完成一个共同的任务,即群体行为。群体行为识别的一个典型的应用场景是体育视频理解,体育战术自动分析等关键技术,具有重要的应用前景和商业价值。但由于背景杂乱、个体之间的关系复杂等原因,使得面向体育视频的行为识别成为一个及其重要而又非常具有挑战性的问题。本文对体育运动排球视频的行为识别存在的问题进行了深入研究,并使用TensorFlow深度学习框架作为代码实现基础,分别从单人的时序信息和注意力机制提升特征表示能力两个方面进行研究,其主要研究内容主要包括:1)提出了一个基于ROI的排球视频行为识别网络。该网络首先使用改进的全卷积网络(MFCN)进行多级特征提取,应用深度全卷积网络(DFCN)对排球运动员的ROI进行初检测,再利用马尔科夫随机场(MRF)进行ROI的微调以获得最终运动员们的ROI集合;然后,从单人行为的时序信息入手,将目标运动员的ROI时间序列进行时序推理,得到单人行为的预测结果;最后使用ROI匹配递归卷积网络进行群体行为的时序建模,生成群体行为的预...

【文章页数】:73 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状与存在的问题
    1.3 本文主要工作
    1.4 本文章节安排
第2章 相关理论基础知识介绍
    2.1 全卷积网络
    2.2 递归神经网络
        2.2.1 RNN模型结构
        2.2.2 RNN的反向传播
    2.3 非极大值抑制
    2.4 池化方式
    2.5 注意力机制
    2.6 本章总结
第3章 基于ROI的排球视频行为识别网络研究
    3.1 引言
    3.2 MFCN多级特征提取
    3.3 ROI的检测与微调
    3.4 基于 ROI 的单人行为时序推理
    3.5 基于ROI匹配的群体行为识别
    3.6 算法步骤
    3.7 实验设置与结果分析
        3.7.1 数据集介绍
        3.7.2 评价指标及实验设置
        3.7.3 实验结果
        3.7.4 实验讨论
    3.8 本章小结
第4章 基于双重注意力的排球视频群体行为识别网络研究
    4.1 引言
    4.2 面向排球视频的空间注意力模型
        4.2.1 空间注意力矩阵的生成
        4.2.2 特征融合策略
        4.2.3 面向排球视频的空间注意力模型伪代码
    4.3 面向排球视频的通道注意力模型
        4.3.1 全局描述符的生成
        4.3.2 获取通道相关性
        4.3.3 特征融合策略
        4.3.4 面向排球视频的通道注意力模型伪代码
    4.4 面向排球视频的双重注意力模型
    4.5 基于双重注意力的排球视频群体行为识别网络融合
    4.6 实验结果及讨论
        4.6.1 网络结构讨论
        4.6.2 关于通道注意力模型讨论
        4.6.3 基于 ROI 的单人行为时序推理模型与双重注意力模型的对比实验
        4.6.4 与先进算法的对比实验
    4.7 本章小结
第5章 总结与展望
    5.1 论文工作总结
    5.2 未来工作展望
参考文献
深圳大学指导教师对研究生学位论文的学术评语
深圳大学研究生学位(毕业)论文答辩委员会决议书
致谢
攻读硕士学位期间的研究成果



本文编号:3863510

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3863510.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c1f7d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com