网络视频中特定图像内容识别技术研究

发布时间:2021-10-24 09:18
  随着互联网快速发展,以互联网作为载体的信息传播速度越来越快、范围越来越广。不良违法分子,利用互联网传播快速的特点,大量的通过网络社交媒体发布煽动性言论、图片或视频。暴恐视频或图像非法传播已成为当前影响社会稳定的毒源之一。如何阻断不良信息通过互联网的传播,已经成为当前研究的热点。本文研究总结已有的不良信息阻断方法,提出对用户侧的网络视频中的特定图像内容进行检测。针对特定图像内容检测,主要研究图像中包含“持枪并保持射击姿态的人”,本文的研究工作如下:分析现有的物体检测方法并选择Faster R-CNN作为枪支检测模型,该模型在常规的基于卷积神经网络进行物体分类的基础上,还可以给出被识别物体对应的位置信息,为后续人与枪支的交叠区域检测提供依据。本文中共识别4种枪支类型,分别为:AK47、M16、92式、95式。收集原始数据后,通过旋转增量技术,将每一类的枪支数据集扩展到约3600张。通过对使用不同的特征提取网络的Faster R-CNN模型训练后,记录各个模型识别每一类别枪支的识别精度和记录各个模型的mAP指标进行对比,确认使用ResNet-50网络作为特征提取网络时的检测结果优于使用其它两... 

【文章来源】:北方工业大学北京市

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

网络视频中特定图像内容识别技术研究


图2-3卷积神经网络的基本原理及训练过程示意图??通过不同的卷积层对数据进行卷积操作后,特征图中包含一些有意义的特??

示意图,函数,激活函数,数学


第二章基于快速区域卷积神经网络的枪支识别方法??激活函数包括:Logistic-Sigmoid?函数,图?2-4?(a)、Tanh-Sigmoid?函数,图?2-4??(b)、ReLU?函数,图?2-4?(c)、LeakyReLU?函数,图?2-4?(d)。??_j:??(a)?(b)??.....?1?..1?丨'.i—…1? ̄ ̄i? ̄y??(C)?(d)??图2-4激活函数示意图??(1)?Sigmoid?类函数??Logistic-Sigmoid函数和Tanh-Sigmoid函数作为早期神经网络研究时最早出??现的激活函数一直被沿用至今,其数学表达式如下:??/W?=点?(2-4)??tanh(^)?=?^—(2-5)??上述函数均具有软饱和性,Logistic-Sigmoid函数的输出范围为(0,?1)、??Tanh-Sigmoid函数的输出范围是(-1,1)。文献[42]中详细的讨论这两个函数饱??和的特点及现象。在手写体字符识别任务中,网络的激活函数选择Tanh-Sigmoid??函数的收敛速度更快,原因是Tanh-Sigmoid函数输出的均值相比于??Logistic-Sigmoid更接近于0。当使用反向传播算法训练神经网络时,其计算的梯??度结果作为损失函数向后传播,当CNN中包含多个卷积层时,其梯度值会趋于??0,这种现象称作梯度消失/弥散现象,这会导致神经元的权值无法被更新[42】。所??以这种函数在更深的卷积神经网络中逐渐的被淘汰。??(2)?ReLU?函数??ReLU函数又称作线性修正单元,其数学表达式为:??f(x)?=?Max(0,x)?(2-6)??当ReLU

示意图,网络结构,示意图,学习领域


R-CNN)?[17],首次将物体检测技术通过深度学习实现。该模型将PASCALVOC??2010数据集的平均精度值[17]从35.1%提升至53.7%。R-CNN可以看作??是机器视觉领域和深度学习领域的一次成功融合。该模型首先,使用训练数据对??CNN网络进行调优(Fine-tuning);然后,使用选择性搜索方法(Selective?Search)??[45]在原始图像的每一幅图片中标记出1000个?2000个被识别物体的候选框并将??候选框中的图像内容送到CNN模型进行识别,如图2-5;最后通过分类器对候??选框中的内容进行分类。??■?_=:綱?|??EteS*?figMf?(约a)?較侯选区脚认?分類络?射溢臬??图2-5?R-CNN网络结构示意图??13??

【参考文献】:
期刊论文
[1]一种自适应加权HOG特征的人脸识别算法[J]. 胡丽乔,仇润鹤.  计算机工程与应用. 2017(03)
[2]基于后验HOG特征的多姿态行人检测[J]. 刘威,段成伟,遇冰,柴丽颖,袁淮,赵宏.  电子学报. 2015(02)
[3]BP神经网络在软件项目风险评估中的应用[J]. 李华,曹晓龙,成江荣.  计算机仿真. 2011(07)
[4]BP神经网络组合预测在城市生活垃圾产量预测中应用[J]. 路玉龙,韩靖,余思婧,张鸿雁.  环境科学与技术. 2010(05)
[5]基于URL过滤与内容过滤的网络净化模型[J]. 李石君,李洲,余军,张科.  计算机技术与发展. 2006(01)
[6]决策树算法的研究及优化[J]. 王静红,王熙照,邵艳华,王伍伶.  微机发展. 2004(09)
[7]基于分层高斯混合模型的半监督学习算法[J]. 孙广玲,唐降龙.  计算机研究与发展. 2004(01)

硕士论文
[1]基于深度学习的不良图片过滤技术研究[D]. 杨源.北方工业大学 2018
[2]基于CNN的交通标志识别方法研究[D]. 杨振杰.天津工业大学 2017
[3]基于云计算的智能手机信息过滤系统[D]. 孙巧萍.南京邮电大学 2016
[4]基于内容的网络敏感图像识别研究[D]. 耿震.北京工业大学 2016
[5]基于Kinect的自然人机交互系统的设计与实现[D]. 马风力.浙江大学 2016
[6]基于Kinect的手势识别技术在人机交互中的应用研究[D]. 陈一新.西南交通大学 2015
[7]基于卷积神经网络的交通标识识别研究与应用[D]. 杨心.大连理工大学 2014
[8]基于HOG特征的人脸识别系统研究[D]. 慕春雷.电子科技大学 2013



本文编号:3455018

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3455018.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5a091***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com