煤矿探水卸杆动作识别研究
发布时间:2021-02-01 12:12
针对煤矿井下探水作业监工人员通过观看视频来监控卸杆作业的方式存在效率低下且极易出错的问题,提出利用三维卷积神经网络(3DCNN)模型对探水作业中的卸杆动作进行识别。3DCNN模型使用3D卷积层自动完成动作特征提取,通过3D池化层对运动特征进行降维,通过Softmax分类处理来识别卸杆动作,并使用批量归一化层提高模型的收敛速度和识别准确率。采用3DCNN模型对卸杆动作进行识别时,首先对数据集进行预处理,从每段视频中均匀抽取几帧图像作为某动作的代表,并降低分辨率;然后采用训练集对3DCNN模型进行训练,并保存训练好的权重文件;最后采用训练好的3DCNN模型对测试集进行测试,得出分类结果。实验结果表明,设置采样帧数为10帧、分辨率为32×32、学习率为0.000 1,3DCNN模型对卸杆动作的识别准确率最高可达98.86%。
【文章来源】:工矿自动化. 2020,46(07)北大核心
【文章页数】:6 页
【部分图文】:
卸杆动作分解
BN层主要用于降低梯度对网络中参数值的依赖性,可使网络以较大的学习率进行训练,还可对每层的输出进行归一化[14],并减少Dropout层的使用。主要思路是对每个神经元引入2个可学习参数,其前向传导过程如图2所示。其中d和d^分别为变换前后的输入数据;μB为小批次(mini-batch)的均值;σB为mini-batch的标准差;ε为保证分母大于零引入的一个非常小的常数;γ,β为需要学习的参数。BN层实现方法是在每层输入时,插入归一化层,将输入数据归一化为均值是0、方差是1的标准正态分布。图2中阶段(1)实现输入数据的归一化,由于层与层之间进行归一化处理后会改变数据分布,破坏学习特征,所以,利用阶段(2)实现变换重构,以恢复该层学习特征。
为对比学习率对准确率和收敛速度的影响,从每个视频中均匀抽取10帧图像,并将这些图像尺寸处理为32×32。在训练时,设置batch-size为20,学习率为0.000 1,0.000 5,0.001,模型迭代训练500次,结果如图4所示。从图4可看出,学习率对迭代次数的影响可以忽略不计;学习率为0.000 1时,模型准确率更为稳定,最高准确率为98.86%。
【参考文献】:
期刊论文
[1]基于HOG特征提取与SVM驾驶员注意力分散行为检测方法研究[J]. 卜庆志,裘君,胡超. 集成技术. 2019(04)
[2]基于卷积神经网络的手势动作雷达识别方法[J]. 王俊,郑彤,雷鹏,张原,樵明朗. 北京航空航天大学学报. 2018(06)
[3]煤矿事故分析与煤矿大数据和物联网[J]. 孙继平. 工矿自动化. 2015(03)
[4]基于多时空特征的人体动作识别算法[J]. 宋健明,张桦,高赞,张燕,薛彦兵,徐光平. 光电子.激光. 2014(10)
[5]一种基于SIFT的图像特征匹配方法[J]. 杨世沛,陈杰,周莉,刘健,刘海洋. 电子测量技术. 2014(06)
[6]一种基于WPT和LVQ神经网络的手部动作识别方法[J]. 罗志增,熊静,刘志宏. 模式识别与人工智能. 2010(05)
[7]动作识别与行为理解综述[J]. 徐光祐,曹媛媛. 中国图象图形学报. 2009(02)
硕士论文
[1]基于改进稠密轨迹的人体行为识别方法研究[D]. 孙玉玲.天津工业大学 2017
本文编号:3012756
【文章来源】:工矿自动化. 2020,46(07)北大核心
【文章页数】:6 页
【部分图文】:
卸杆动作分解
BN层主要用于降低梯度对网络中参数值的依赖性,可使网络以较大的学习率进行训练,还可对每层的输出进行归一化[14],并减少Dropout层的使用。主要思路是对每个神经元引入2个可学习参数,其前向传导过程如图2所示。其中d和d^分别为变换前后的输入数据;μB为小批次(mini-batch)的均值;σB为mini-batch的标准差;ε为保证分母大于零引入的一个非常小的常数;γ,β为需要学习的参数。BN层实现方法是在每层输入时,插入归一化层,将输入数据归一化为均值是0、方差是1的标准正态分布。图2中阶段(1)实现输入数据的归一化,由于层与层之间进行归一化处理后会改变数据分布,破坏学习特征,所以,利用阶段(2)实现变换重构,以恢复该层学习特征。
为对比学习率对准确率和收敛速度的影响,从每个视频中均匀抽取10帧图像,并将这些图像尺寸处理为32×32。在训练时,设置batch-size为20,学习率为0.000 1,0.000 5,0.001,模型迭代训练500次,结果如图4所示。从图4可看出,学习率对迭代次数的影响可以忽略不计;学习率为0.000 1时,模型准确率更为稳定,最高准确率为98.86%。
【参考文献】:
期刊论文
[1]基于HOG特征提取与SVM驾驶员注意力分散行为检测方法研究[J]. 卜庆志,裘君,胡超. 集成技术. 2019(04)
[2]基于卷积神经网络的手势动作雷达识别方法[J]. 王俊,郑彤,雷鹏,张原,樵明朗. 北京航空航天大学学报. 2018(06)
[3]煤矿事故分析与煤矿大数据和物联网[J]. 孙继平. 工矿自动化. 2015(03)
[4]基于多时空特征的人体动作识别算法[J]. 宋健明,张桦,高赞,张燕,薛彦兵,徐光平. 光电子.激光. 2014(10)
[5]一种基于SIFT的图像特征匹配方法[J]. 杨世沛,陈杰,周莉,刘健,刘海洋. 电子测量技术. 2014(06)
[6]一种基于WPT和LVQ神经网络的手部动作识别方法[J]. 罗志增,熊静,刘志宏. 模式识别与人工智能. 2010(05)
[7]动作识别与行为理解综述[J]. 徐光祐,曹媛媛. 中国图象图形学报. 2009(02)
硕士论文
[1]基于改进稠密轨迹的人体行为识别方法研究[D]. 孙玉玲.天津工业大学 2017
本文编号:3012756
本文链接:https://www.wllwen.com/kejilunwen/anquangongcheng/3012756.html