基于语义分割的食品标签文本检测

发布时间:2021-11-29 10:10
  食品包装上的标签文本含有生产日期、营养成分、生产厂家等食品相关信息,这些不仅为消费者购买食品提供了重要依据,也有助于食品监督抽检机构发现潜在的食品安全问题。食品标签文本检测是食品标签自动识别的前提,有助于降低人工录入成本、提高数据处理效率。基于食品包装图像构建数据集,提出了一种基于语义分割的距离场模型,以检测食品标签。该模型包含像素分类和距离场回归两类任务,其中像素分类任务分割处理图像中的文本区域,距离场回归任务预测文本区域内的像素点到该区域边界的归一化距离。为提升模型的检测性能,在回归预测模块中通过增加注意力模块优化模型结构,并针对距离场回归任务损失值过小、影响模型训练优化问题对其损失函数进行了改进。消融实验结果表明,增加注意力模块和损失函数的改进使得模型的准确率分别提高了4.39、3.80个百分点,有效提高了检测准确率。食品包装图像数据集的对比实验表明,采用本文模型检测食品标签文本具有较好的性能,其召回率、准确率分别达到87.61%、76.50%。 

【文章来源】:农业机械学报. 2020,51(08)北大核心EICSCD

【文章页数】:8 页

【部分图文】:

基于语义分割的食品标签文本检测


基于语义分割的距离场模型检测流程

示例,图像,文本,模型


针对食品包装图像中的标签文本检测,提出一种基于语义分割的距离场模型(Semantic segmentation based distance field model,DFM),该模型包含像素分类任务和距离场回归任务。DFM能够根据神经网络模型预测图像中文本区域内像素点至其边界的归一化距离以及文本与背景分割图。为了有效利用像素分类任务与距离场回归任务之间存在的联系以提升模型的检测效果,在回归预测模块中增加了注意力模块,并且针对距离场回归任务损失值过小导致模型训练优化不佳的问题,对其损失函数提出改进,以提高模型的预测准确率。最后根据DFM两类任务的预测结果利用扩展分组算法获得食品包装的标签文本区域。2.1 模型框架

场模型,语义,卷积和,采样函数


如图3所示,将ResNet-50网络中不同阶段得到语义特征f1、f2、f3和f4通过卷积和上采样运算得到不同维度融合特征P1、P2、P3和P4,其计算方式为式中Up×s———s倍上采样函数

【参考文献】:
期刊论文
[1]农业信息成像感知与深度学习应用研究进展[J]. 孙红,李松,李民赞,刘豪杰,乔浪,张瑶.  农业机械学报. 2020(05)
[2]基于深度学习的自然场景文本检测与识别综述[J]. 王建新,王子亚,田萱.  软件学报. 2020(05)
[3]食品安全大数据的融合及分类技术综述[J]. 张素智,陈小妮,李鹏辉,杨芮,蔡强.  计算机技术与发展. 2020(02)
[4]基于深度学习的图像语义分割方法综述[J]. 田萱,王亮,丁琪.  软件学报. 2019(02)
[5]食品安全监督存在的问题与解决措施分析[J]. 袁云.  食品安全导刊. 2018(06)



本文编号:3526320

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3526320.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a44a6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com