基于深度神经网络的便利店商品检测与识别算法研究
发布时间:2021-11-16 06:40
随着网络技术的飞速发展,无人超市作为新零售模式被广泛关注。无人超市现有解决方案多通过对商品贴装RFID设备实现,成本偏高。近年深度神经网络的发展迅速,随之而来的是目标检测算法的快速更迭,使基于计算机视觉的无人超市解决方案成为可能。故本文以深度神经网络为基础,研究便利店的商品检测与识别算法。本文首先对目标检测算法在泛化数据集上的性能表现进行了研究。深度神经网络拥有强特征表达能力的优势,在检测与识别任务中都有突出的表现,故现有目标检测算法多以深度神经网络为基础。商品识别以精度为第一指标,本文着重研究基于区域的检测识别算法。Faster R-CNN模型是基于区域的检测算法中的重要模型,在对该模型进行深入研究后,本文对Faster R-CNN模型中的特征提取网络表达特征尺度不够丰富的问题作出改进,提出了基于多尺度特征融合的Faster R-CNN模型,并在VOC2007数据集上提升了检测的准确率。在泛化数据集的研究基础之上,本文针对便利店商品数据集的特性:商品尺寸差异大、遮挡明显和细长商品较多,提出了基于深度多尺度特征融合的商品检测算法。该算法以Faster R-CNN为基础,将特征提取网络改...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
三种卷积模式
转变为了输入图像经过一次特征提取网络,使用多任务训练(Multi-task)将区域分类与ax 分类器代替 SVM,直接输出分类得分,Fast R-CNN 相比于 R-CNN 在训练速度、检测支持实时目标检测任务为着眼点的 Faster R 73.2%mAP 的结果,同时处理速度达到了 5故 Faster R-CNN 模型作为目标检测领域内在 Fast R-CNN 的基础上进一步将区域推荐网络中,实现了端到端学习。使用区域推荐N)代替选择性搜索(Selective Search)算法度更快同时更加准确;特征提起网络的选择t 与 VGG-Net 代替了 Alex-Net,更深的网络下:
第三章 基于多尺度特征融合的目标检测模型29图3.4 区域推荐网络示意图如上图所示,区域推荐网络对每个滑动窗口根据三种不同尺度(8,16,32)和三种不同长宽比[1:2,1:1,2:1]构造 9 个预候选框(anchor),即上图中的k 。在次级网络中,框回归任务输出为4 9,即对每一个候选框的四个坐标参数(中心点坐标以及框的长宽)预测一组偏移量,采用 L1 平滑损失函数
【参考文献】:
期刊论文
[1]基于改进Faster R-CNN算法的车辆检测[J]. 林国平,余晓龙. 闽南师范大学学报(自然科学版). 2019(01)
[2]基于改进Faster R-CNN的Logo目标检测方法[J]. 黄明珠,黄文清. 计算机系统应用. 2019(02)
硕士论文
[1]基于深度学习的大规模商品图像分类研究[D]. 艾姗姗.北京交通大学 2018
[2]基于卷积神经网络的铁轨表面缺陷识别研究[D]. 刘雄祥.西南科技大学 2018
[3]商品图像检测方法的研究[D]. 王智慧.北京邮电大学 2018
[4]基于区域的卷积神经网络及其在静态目标检测方面的应用[D]. 王飞.北京邮电大学 2017
本文编号:3498350
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
三种卷积模式
转变为了输入图像经过一次特征提取网络,使用多任务训练(Multi-task)将区域分类与ax 分类器代替 SVM,直接输出分类得分,Fast R-CNN 相比于 R-CNN 在训练速度、检测支持实时目标检测任务为着眼点的 Faster R 73.2%mAP 的结果,同时处理速度达到了 5故 Faster R-CNN 模型作为目标检测领域内在 Fast R-CNN 的基础上进一步将区域推荐网络中,实现了端到端学习。使用区域推荐N)代替选择性搜索(Selective Search)算法度更快同时更加准确;特征提起网络的选择t 与 VGG-Net 代替了 Alex-Net,更深的网络下:
第三章 基于多尺度特征融合的目标检测模型29图3.4 区域推荐网络示意图如上图所示,区域推荐网络对每个滑动窗口根据三种不同尺度(8,16,32)和三种不同长宽比[1:2,1:1,2:1]构造 9 个预候选框(anchor),即上图中的k 。在次级网络中,框回归任务输出为4 9,即对每一个候选框的四个坐标参数(中心点坐标以及框的长宽)预测一组偏移量,采用 L1 平滑损失函数
【参考文献】:
期刊论文
[1]基于改进Faster R-CNN算法的车辆检测[J]. 林国平,余晓龙. 闽南师范大学学报(自然科学版). 2019(01)
[2]基于改进Faster R-CNN的Logo目标检测方法[J]. 黄明珠,黄文清. 计算机系统应用. 2019(02)
硕士论文
[1]基于深度学习的大规模商品图像分类研究[D]. 艾姗姗.北京交通大学 2018
[2]基于卷积神经网络的铁轨表面缺陷识别研究[D]. 刘雄祥.西南科技大学 2018
[3]商品图像检测方法的研究[D]. 王智慧.北京邮电大学 2018
[4]基于区域的卷积神经网络及其在静态目标检测方面的应用[D]. 王飞.北京邮电大学 2017
本文编号:3498350
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3498350.html
最近更新
教材专著