基于深度学习的校园视频检索算法应用研究
发布时间:2021-02-16 02:56
随着多媒体技术和网络技术的迅速发展,各种视频存储和压缩技术的相继出现,视频信息的获取、传播和存储变得越来越简单方便,研究视频序列,能挖掘出更多有价值的信息。近年来,随着计算机视觉、机器学习、深度学习等领域技术的高速发展,对视频中人物进行有效快速地检索成为基于内容的视频检索领域研究的热点。深度学习是机器学习领域中的新兴分支之一,其具有超强的学习能力,以及优于传统使用手工提取图像特征的能力,因而得到了越来越多的研究者的青睐。现如今校园内或者教室中都安装了摄像头,有大量视频数据,可以挖掘其中丰富的信息。所以本文针对这种场景,通过对人脸检测和人脸识别算法的基础理论和关键技术的深入研究,设计并实现了一个基于深度学习的校园视频检索系统。主要研究内容如下:设计了适于视频检索的卷积神经网络人脸检测算法。在AlexNet卷积神经网络的基础上,通过加深网络的层数,减小卷积层Filter大小等方法设计了一个基于卷积神经网络的人脸检测算法,该算法模型在测试集上达到了98.78%的准确率。改进了传统的人脸跟踪算法。为了提高人脸检测在视频中的稳定性,本文引入了人脸跟踪算法。但传统的人脸跟踪算法,时间复杂度较高,为...
【文章来源】:内蒙古工业大学内蒙古自治区
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
LeNet-5网络模型框架
最大池化
图 2-4 全连接和局部连接Fig. 2-4 Full Connection And Local Connection数网络中,激活函数的存在具有重要的意义。激活函数的解决线性因素带来的表达能力不足的问题。卷积神经网Sigmoid,Tanh,ReLU[36]及其改进版本 PReLU[37]等。其经逐渐被 ReLU 函数及其改进版本取代。激活函数够把输入的连续实值控制到 0 和 1 之间。尤其注意,如出就是 0;如果是特别大的正数,输出就是 1。数的表达式,见(2-1): ( ) =
本文编号:3036024
【文章来源】:内蒙古工业大学内蒙古自治区
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
LeNet-5网络模型框架
最大池化
图 2-4 全连接和局部连接Fig. 2-4 Full Connection And Local Connection数网络中,激活函数的存在具有重要的意义。激活函数的解决线性因素带来的表达能力不足的问题。卷积神经网Sigmoid,Tanh,ReLU[36]及其改进版本 PReLU[37]等。其经逐渐被 ReLU 函数及其改进版本取代。激活函数够把输入的连续实值控制到 0 和 1 之间。尤其注意,如出就是 0;如果是特别大的正数,输出就是 1。数的表达式,见(2-1): ( ) =
本文编号:3036024
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3036024.html