基于全卷积神经网络的行人遮挡检测研究
发布时间:2021-03-06 08:53
行人检测作为目标检测领域的热点之一,在无人驾驶汽车辅助系统、智能监控系统和服务型智能机器人等应用领域具有非常高的价值。本文研究的行人遮挡可以被划分为人对人的自遮挡与物体对人的遮挡的两种遮挡类型。人对人的遮挡主要是因为多个行人间有重叠区域导致预测框容易产生偏移至周围其他行人而产生漏检;物体对人的遮挡主要是因为行人被建筑物、树木和汽车等非行人物体遮挡导致无法获得完整的行人信息而产生误检或漏检。为了提高行人检测的性能,文中主要对这两种遮挡情况进行处理。针对人对人的遮挡问题,本文设计了基于全卷积神经网络的行人类内遮挡模型,该模型由VGG16、特征金字塔和两个全卷积子任务组成。该模型通过引入排斥损失函数,使得候选框远离邻近的非目标标注框,即最小化预测框和其他目标标注框的重叠区域,避免预测框偏移到其他标注框的区域,从而有效地降低人与人遮挡的误检率。针对物体对人的遮挡问题,本文提出基于语义注意力模型的行人遮挡检测模型,该模型是在行人类内遮挡模型的基础上进行优化。其主要包括语义分割模块和检测模块。语义分割模块利用行人的可见边界框作为标签来进行语义分割,目的是获得被物体、背景遮挡的行人的注意力热点图。检...
【文章来源】:广东工业大学广东省
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
行人遮挡类型
随着深度学习在图像处理领域的广泛应用且取得大量的成果,许多学者和企中心也逐渐研究采用深度学习的方法来解决行人遮挡检测问题。下面将具体阐学习中常用的卷积神经网络的结构和各部分的计算过程、语义分割网络的语义产生过程以及部分模块的工作原理和作用。通过对以下内容的了解,将更有助遮挡检测系统的设计与构建。1 行人检测的原理基于机器学习的方法是现阶段行人检测算法的主流,主要运用特征提取和分两个模块来进行检测图像或视频帧中的行人。特征提取部分主要是获得边缘特色特征、纹理特征等行人外观特征和深度语义特征信息,然后把这些特征运用分类器,将背景和行人目标两个类别进行高效地辨别并输出分类结果。最后对测试图像进行检测,若存在行人目标则输出其预测框,如图 2-1 所示。
经网络利用网络层学习到的特征具有更好的判别性和泛化性。大量研究表明,这种端到端的学习模式更有利于实现图像识别的最佳状态。2.2.1 卷积神经网络如图 2-2 所示,常见的卷积神经网络主要把卷积层、池化层和全连接层组合成基本的结构。其中,CNN 的输入是一些原始数据,例如 RGB 图像,原始音频数据等;而输出是图像属于各个类别的置信度。卷积层的作用是将输入的数据进行卷积得到特征图,即提取特征;池化层主要的作用是进行下采样,以去掉特征图中不重要的部分的方式,来降低网络参数的数量;而全连接层的作用是实现分类。卷积神经网络的底层是对图像局部进行感受野操作,然后运用卷积运算,汇集运算和非线性变映射,最后得到分类概率。当各卷积层利用卷积核得到后一层的特征图像,再用激活函数进行非线性变换时,网络的表达和拟合能力得到提升。通过各个层对输入数据的逐层抽象和表达,就可以提取到图像的高级语义信息,学到的特征更具有辨别性。
【参考文献】:
期刊论文
[1]基于激光雷达的舞蹈机器人室内行人跟踪方法[J]. 刘召,宋立滨,耿美晓,于涛,王增喜,郭凯. 计算机工程. 2017(06)
[2]复杂场景下的人体行为识别研究新进展[J]. 雷庆,陈锻生,李绍滋. 计算机科学. 2014(12)
[3]行人检测技术研究综述[J]. 张春凤,宋加涛,王万良. 电视技术. 2014(03)
[4]行人检测技术综述[J]. 苏松志,李绍滋,陈淑媛,蔡国榕,吴云东. 电子学报. 2012(04)
[5]智能车辆安全辅助驾驶技术研究近况[J]. 王荣本,郭烈,金立生,顾柏园,余天洪. 公路交通科技. 2007(07)
[6]车辆辅助驾驶系统中基于计算机视觉的行人检测研究综述[J]. 贾慧星,章毓晋. 自动化学报. 2007(01)
本文编号:3066799
【文章来源】:广东工业大学广东省
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
行人遮挡类型
随着深度学习在图像处理领域的广泛应用且取得大量的成果,许多学者和企中心也逐渐研究采用深度学习的方法来解决行人遮挡检测问题。下面将具体阐学习中常用的卷积神经网络的结构和各部分的计算过程、语义分割网络的语义产生过程以及部分模块的工作原理和作用。通过对以下内容的了解,将更有助遮挡检测系统的设计与构建。1 行人检测的原理基于机器学习的方法是现阶段行人检测算法的主流,主要运用特征提取和分两个模块来进行检测图像或视频帧中的行人。特征提取部分主要是获得边缘特色特征、纹理特征等行人外观特征和深度语义特征信息,然后把这些特征运用分类器,将背景和行人目标两个类别进行高效地辨别并输出分类结果。最后对测试图像进行检测,若存在行人目标则输出其预测框,如图 2-1 所示。
经网络利用网络层学习到的特征具有更好的判别性和泛化性。大量研究表明,这种端到端的学习模式更有利于实现图像识别的最佳状态。2.2.1 卷积神经网络如图 2-2 所示,常见的卷积神经网络主要把卷积层、池化层和全连接层组合成基本的结构。其中,CNN 的输入是一些原始数据,例如 RGB 图像,原始音频数据等;而输出是图像属于各个类别的置信度。卷积层的作用是将输入的数据进行卷积得到特征图,即提取特征;池化层主要的作用是进行下采样,以去掉特征图中不重要的部分的方式,来降低网络参数的数量;而全连接层的作用是实现分类。卷积神经网络的底层是对图像局部进行感受野操作,然后运用卷积运算,汇集运算和非线性变映射,最后得到分类概率。当各卷积层利用卷积核得到后一层的特征图像,再用激活函数进行非线性变换时,网络的表达和拟合能力得到提升。通过各个层对输入数据的逐层抽象和表达,就可以提取到图像的高级语义信息,学到的特征更具有辨别性。
【参考文献】:
期刊论文
[1]基于激光雷达的舞蹈机器人室内行人跟踪方法[J]. 刘召,宋立滨,耿美晓,于涛,王增喜,郭凯. 计算机工程. 2017(06)
[2]复杂场景下的人体行为识别研究新进展[J]. 雷庆,陈锻生,李绍滋. 计算机科学. 2014(12)
[3]行人检测技术研究综述[J]. 张春凤,宋加涛,王万良. 电视技术. 2014(03)
[4]行人检测技术综述[J]. 苏松志,李绍滋,陈淑媛,蔡国榕,吴云东. 电子学报. 2012(04)
[5]智能车辆安全辅助驾驶技术研究近况[J]. 王荣本,郭烈,金立生,顾柏园,余天洪. 公路交通科技. 2007(07)
[6]车辆辅助驾驶系统中基于计算机视觉的行人检测研究综述[J]. 贾慧星,章毓晋. 自动化学报. 2007(01)
本文编号:3066799
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3066799.html