针对杂菜识别问题的基于多标签分类的自适应多尺度逐区域方法

发布时间:2021-04-26 06:11
  杂菜是食物图片当中的一类特殊图片,它属于多标签数据,但不同于一般的多标签数据,其所有菜肴都盛放在同一个容器当中,菜肴不规则的形状以及相互之间的重叠和边界的混杂为识别任务带来了极大的挑战。当今,随着人们对健康生活方式的日益关注和追求,各类相关网页应用和APP等层出不穷,因此作为饮食记录、营养分析和食谱推荐等分支应用的底层技术,食物图片识别受到了越来越多的关注。食物识别任务从早期的手工特征提取和分类发展到后期的端到端深度模型,处理的数据也从开始的单标签图片到每道菜肴盛放在不同容器中的多标签图片,但目前还没有专门针对所有菜肴盛放在同一容器的多标签图片(即杂菜)进行的研究。此外,已有的深度模型也多将食物识别当作目标检测任务加以处理,需要强监督信息的指导才能得出预测结果。本文针对杂菜识别问题进行了深入研究,提出了一种自适应的多尺度逐区域解决方案,以多标签分类的视角而非目标检测的视角对富有挑战性的杂菜数据进行了处理,基于“每个区域应当包含某类菜肴的一部分”这一直觉假设将特征进行了逐区域的划分,并在此过程当中充分利用了特征图所反映出的位置信息。并根据“各菜肴的食材大小与混杂程度不同,数据采集时拍摄距... 

【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校

【文章页数】:68 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第1章 绪论
    1.1 研究背景与意义
    1.2 研究现状
    1.3 食物识别中的杂菜识别
    1.4 主要研究内容和论文结构
        1.4.1 主要研究内容
        1.4.2 论文结构
    1.5 本章小结
第2章 食物图片识别方法概述
    2.1 基于视觉特征提取的图像识别方法
        2.1.1 视觉特征提取
        2.1.2 图像建模
        2.1.3 SVM分类器
    2.2 基于深度学习的目标检测方法
        2.2.1 RCNN系列算法
        2.2.2 YOLO系列算法
        2.2.3 弱监督目标检测算法
    2.3 本章小结
第3章 杂菜识别问题的多尺度逐区域分类方法
    3.1 问题定义
        3.1.1 食物图像标注
        3.1.2 多标签分类问题
    3.2 多尺度逐区域识别方法
        3.2.1 整体架构
        3.2.2 底层神经网络
        3.2.3 逐区域特征提取
        3.2.4 多尺度特征融合
    3.3 本章小结
第4章 自适应区域划分方案
    4.1 特征区域可视化
    4.2 特征图指导区域划分
        4.2.1 选择性搜索
        4.2.2 区域生成网络
        4.2.3 自适应划分方法
    4.3 其他技术
        4.3.1 迁移学习
        4.3.2 损失函数
        4.3.3 负采样
    4.4 本章小结
第5章 实验部分
    5.1 数据集
        5.1.1 Rice数据集
        5.1.2 BeeHoon数据集
    5.2 实验环境和配置
        5.2.1 实验环境
        5.2.2 参数设置
    5.3 实验结果
        5.3.1 迁移学习和负采样的提升效果
        5.3.2 多尺度逐区域方法的提升效果
        5.3.3 自适应划分方法的提升效果
        5.3.4 方法的有效性和针对性
    5.4 本章小结
第6章 总结与展望
    6.1 工作总结
    6.2 工作展望
参考文献
作者简介及在学期间所取得的科研成果
致谢



本文编号:3160891

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3160891.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8d9fa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com