工厂监控视频中的安全帽检测
发布时间:2021-03-07 01:38
安全帽佩戴检测是实现安全生产的重要环节。随着监控设备日益普及,监控视频的数量飞速上涨,如何将这些视频资源用于智能检测已经成为一种迫切的需求。近年来基于深度学习的方法在目标检测和图像分类上取得了不错的进展,但大多基于公共数据集,在工业场景中应用时还存在一些准确性和速度上的问题。将安全帽的检测分为人体检测和安全帽检测。以工厂监控视频帧为研究对象,构建了一个使用边界框进行标注的人体检测数据集,该数据集包含3029张图像,共包括近万个人体目标。使用该数据集对Faster R-CNN进行训练以实现人体检测,针对目标规模小的特点,修改Faster R-CNN的参数,包括anchors的尺寸和RPN中的阈值;针对目标分布密集的特点,使用soft-NMS改进后处理过程,在不重新训练模型的情况下提高人体检测的准确性。在不使用工厂室内图像作为训练集的情况下,将室内场景数据加入验证集防止模型训练时过拟合,加强了模型的泛化能力。根据人体长宽比确定工人头部位置,使用滑动窗口缩小安全帽的范围,以便使用传统方法或神经网络对安全帽进行分类。使用数据集对改进的模型进行训练并测试,结果表明基于Faster R-CNN的改...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
整体流程图
一般用于人体检测的神经网络按照结构可以分为单阶段网络(one-stage network)、两阶段网络(two-stage network)和多阶段网络(multi-stage network)。单阶段网络包括 YOLO 系列和 SSD 等,其识别准确率较低,但是检测速度较快;两阶段网络包括 Fast R-CNN 和 Faster R-CNN 等,其识别准确率较高,但是检测速度较慢;多阶段网络包括 R-CNN 和 SPPNet 等,其识别准确率极低,检测速度也极慢,如今已很少在实际工业环境中使用。单阶段网络通过 anchor 列举出候选框后直接进行多分类和回归以完成识别和定位,不生成候选区域。单阶段表示它仅使用一个 CNN 直接预测目标的类别和位置,这也是其速度快和准确率低的原因。多阶段网络一般先通过选择性搜索(selective search)获取候选区域,再进行回归并利用 SVM 进行多分类。称为多阶段是因为选择性搜索、特征提取、回归和分类是分成多个阶段单独进行训练的。选择性搜索属于传统机器学习的算法,在检测网络中计算时间最长,在 Faster R-CNN 中已经被 RPN 取代。
华 中 科 技 大 学 硕 士 学 位 论 文穷举候选框时的特征提取网络以及第二阶段中的多分类和回归网络被整合到一个网络中,再加上第一阶段提取候选区域的网络,总共需要对两个网络进行训练,这也是其称为两阶段网络的原因。两阶段网络在第一阶段会抑制掉大量的负样本,使正负样本对损失的贡献尽量相同,这就减少了正负样本不均衡问题带来的影响。2.1.2 Faster R-CNNFaster R-CNN 是经典的两阶段网络,于 2015 年提出,经历了从 R-CNN 到 FasR-CNN 的发展,最终将目标检测的基本步骤统一到一个深度网络框架之中。FasterR-CNN 相对于 Fast R-CNN 在第一阶段进行了改进,利用 RPN 代替选择性搜索,减少了冗余的计算,并且使得训练过程可以使用图形处理器(Graphics Processing UnitGPU)进行加速,提高了检测速度。其网络结构图如图 2.2 所示,fc 表示全连接层,k 表示每个点 anchors 的数量。
本文编号:3068173
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
整体流程图
一般用于人体检测的神经网络按照结构可以分为单阶段网络(one-stage network)、两阶段网络(two-stage network)和多阶段网络(multi-stage network)。单阶段网络包括 YOLO 系列和 SSD 等,其识别准确率较低,但是检测速度较快;两阶段网络包括 Fast R-CNN 和 Faster R-CNN 等,其识别准确率较高,但是检测速度较慢;多阶段网络包括 R-CNN 和 SPPNet 等,其识别准确率极低,检测速度也极慢,如今已很少在实际工业环境中使用。单阶段网络通过 anchor 列举出候选框后直接进行多分类和回归以完成识别和定位,不生成候选区域。单阶段表示它仅使用一个 CNN 直接预测目标的类别和位置,这也是其速度快和准确率低的原因。多阶段网络一般先通过选择性搜索(selective search)获取候选区域,再进行回归并利用 SVM 进行多分类。称为多阶段是因为选择性搜索、特征提取、回归和分类是分成多个阶段单独进行训练的。选择性搜索属于传统机器学习的算法,在检测网络中计算时间最长,在 Faster R-CNN 中已经被 RPN 取代。
华 中 科 技 大 学 硕 士 学 位 论 文穷举候选框时的特征提取网络以及第二阶段中的多分类和回归网络被整合到一个网络中,再加上第一阶段提取候选区域的网络,总共需要对两个网络进行训练,这也是其称为两阶段网络的原因。两阶段网络在第一阶段会抑制掉大量的负样本,使正负样本对损失的贡献尽量相同,这就减少了正负样本不均衡问题带来的影响。2.1.2 Faster R-CNNFaster R-CNN 是经典的两阶段网络,于 2015 年提出,经历了从 R-CNN 到 FasR-CNN 的发展,最终将目标检测的基本步骤统一到一个深度网络框架之中。FasterR-CNN 相对于 Fast R-CNN 在第一阶段进行了改进,利用 RPN 代替选择性搜索,减少了冗余的计算,并且使得训练过程可以使用图形处理器(Graphics Processing UnitGPU)进行加速,提高了检测速度。其网络结构图如图 2.2 所示,fc 表示全连接层,k 表示每个点 anchors 的数量。
本文编号:3068173
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3068173.html
最近更新
教材专著