复杂场景中的行人检测算法研究
发布时间:2021-11-18 06:54
行人检测的任务是判断给定的图像中是否包含行人并给出坐标,有广泛的应用前景。基于人工设计特征的行人检测算法不能有效解决复杂场景中的的行人检测问题,导致出现较严重的误检和漏检情况,而目前所用的基于深度学习的行人检测算法不能有效利用图像语义信息,针对以上问题,本文做了以下研究工作:1.针对基于人工设计特征的行人检测算法不能有效解决复杂场景中的行人检测问题,提出一种基于多级特征融合的行人检测算法,为了增强卷积神经网络提取特征的鲁棒性,在现有网络结构基础上改进得到的网络模型结合卷积神经网络浅层和深层特征,实验表明,该算法在场景较复杂的数据集中也有较好的检测性能,同时增强算法的鲁棒性。2.针对选择性搜索算法产生候选区域速度慢且冗余高的问题,提出行人候选区域去冗余算法,使用多策略融合方式产生质量更高的行人候选区域以提高算法的检测性能,通过结合二值规范化梯度和行人检测器,降低了所生成候选区域的冗余度,实验表明,对于行人检测任务,所提出的行人候选区域去冗余算法能够以很快的速度产生高质量的行人候选区域。3.为了进一步降低复杂背景对算法性能的影响同时有效利用图像本身语义信息,提出基于分割语义优化的行人检测算...
【文章来源】:南京邮电大学江苏省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
CaffeNet网络结构下的深度学习特征示例图
南京邮电大学硕士研究生学位论文 第三章基于多级特征融合的行人检测算法研究set06~set10 五个子集,按照每 30 帧提取一帧共得到 4024 张测试图像,图像大小为 640 480,分辨率普遍较低且行人尺寸较小,测试集中行人正样本定义为高度超过 49 个像素,遮挡小于35%的行人,是所有行人检测数据集中较难检测的数据集。该测试集中的行人包含了遮挡、行人姿态和杂乱背景等复杂场景中行人检测算法需要解决的各种技术难点,如图 3.6 所示为Caltech 数据集测试集图像示例。使用选择搜索性算法在测试集图像上得到行人候选区域,在每张图像上产生约 2000 个行人候选区并用上述训练得到的多级特征融合网络模型做分类,判断该区域是不是行人区域,并以 MissRate 为评价标准的前提下和其他算法做比较。
南京邮电大学硕士研究生学位论文 第三章基于多级特征融合的行人检测算法研究卷积神经网络提取的低层特征和高层特征得到鲁棒性较强的多级融合特征训练分类器,在一定程度上提高算法效果,但是距离完美解决 Caltech 行人数据集上的检测任务还有很长距离,针对其算法缺陷,分析其性能改进可能存在于以下方面:行人候选区域产生步骤的优化。上述基于多级特征融合的行人检测算法以选择性搜索算法作为其候选区域产生器,在每张图像上产生约 2000 个行人候选区是不实际的,因为单张图像上不可能同时存在这么多行人,产生的 2000 个行人候选区域中,有将近 99%都是冗余窗口,而这些区域的存在一方面会增加后续算法的计算量,另一方面产生的所有候选区域中,除了行人目标位置外,还包括汽车等非行人区域,在非行人目标中如果存在类似于行人的区域,则也会对算法性能产生影响,如图 3.8 所示为本章算法在测试集中发生的部分误检情况示意图,图 3.8(a)中将汽车尾灯误检为行人目标,图 3.8(b)中将轮廓与行人类似的交通灯误检为行人,图 3.8(c)中将灯柱误检为行人,从而影响算法整体性能。
【参考文献】:
期刊论文
[1]行人检测技术综述[J]. 苏松志,李绍滋,陈淑媛,蔡国榕,吴云东. 电子学报. 2012(04)
本文编号:3502429
【文章来源】:南京邮电大学江苏省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
CaffeNet网络结构下的深度学习特征示例图
南京邮电大学硕士研究生学位论文 第三章基于多级特征融合的行人检测算法研究set06~set10 五个子集,按照每 30 帧提取一帧共得到 4024 张测试图像,图像大小为 640 480,分辨率普遍较低且行人尺寸较小,测试集中行人正样本定义为高度超过 49 个像素,遮挡小于35%的行人,是所有行人检测数据集中较难检测的数据集。该测试集中的行人包含了遮挡、行人姿态和杂乱背景等复杂场景中行人检测算法需要解决的各种技术难点,如图 3.6 所示为Caltech 数据集测试集图像示例。使用选择搜索性算法在测试集图像上得到行人候选区域,在每张图像上产生约 2000 个行人候选区并用上述训练得到的多级特征融合网络模型做分类,判断该区域是不是行人区域,并以 MissRate 为评价标准的前提下和其他算法做比较。
南京邮电大学硕士研究生学位论文 第三章基于多级特征融合的行人检测算法研究卷积神经网络提取的低层特征和高层特征得到鲁棒性较强的多级融合特征训练分类器,在一定程度上提高算法效果,但是距离完美解决 Caltech 行人数据集上的检测任务还有很长距离,针对其算法缺陷,分析其性能改进可能存在于以下方面:行人候选区域产生步骤的优化。上述基于多级特征融合的行人检测算法以选择性搜索算法作为其候选区域产生器,在每张图像上产生约 2000 个行人候选区是不实际的,因为单张图像上不可能同时存在这么多行人,产生的 2000 个行人候选区域中,有将近 99%都是冗余窗口,而这些区域的存在一方面会增加后续算法的计算量,另一方面产生的所有候选区域中,除了行人目标位置外,还包括汽车等非行人区域,在非行人目标中如果存在类似于行人的区域,则也会对算法性能产生影响,如图 3.8 所示为本章算法在测试集中发生的部分误检情况示意图,图 3.8(a)中将汽车尾灯误检为行人目标,图 3.8(b)中将轮廓与行人类似的交通灯误检为行人,图 3.8(c)中将灯柱误检为行人,从而影响算法整体性能。
【参考文献】:
期刊论文
[1]行人检测技术综述[J]. 苏松志,李绍滋,陈淑媛,蔡国榕,吴云东. 电子学报. 2012(04)
本文编号:3502429
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3502429.html