基于食材信息的食品图像识别方法研究
发布时间:2021-05-23 22:25
食物对人类生活至关重要,是人们生活的基础。随着社交网络、移动网络和物联网的快速发展,人们通常会上传、分享、记录食品图像、食谱、烹饪视频和饮食记录,这样可以轻松获得大规模的食品数据。研究人员可以利用这些食品数据在食品图像领域做各种研究,例如食品图像识别、食品检索等。食品图像识别是开展食品推荐、检索等领域的研究基础,并且有着广泛的实际应用,如多模态的食品记录和个性化的医疗健康等,因此食品图像识别越来越受到关注。现有方法大多数都是使用深度卷积神经网络(Convolutional Neural Network,CNN)直接提取整张图像的视觉特征来进行食品图像识别,而没有考虑食品图像自身的特点。不同于一般的物体图像,食品图像通常不具有独特的空间布局,而且没有共同语义部分。因此,直接使用CNN很难捕获食品图像判别性信息。随着移动互联网的发展,用户不仅上传大量的食品照片,而且提供丰富的食材信息,就像物体对场景的重要性一样,食品图像中的食材对于食品识别同样非常重要。而且许多研究结果表明使用语义上有意义的食材可以作为食品图像识别的属性信息,它从不同的视角和粒度提供互补性信息来提高食品图像的识别性能。此外...
【文章来源】:中国科学院大学(中国科学院大学人工智能学院)北京市
【文章页数】:77 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 技术挑战
1.3 本文的研究内容与主要贡献
1.3.1 本文的研究内容
1.3.2 本文的主要贡献
1.4 论文结构安排
第2章 研究现状概述
2.1 单标签食品图像识别
2.2 多标签食品图像识别
2.3 面向移动端的食品图像识别
2.4 融入上下文信息的食品图像识别
2.5 小结
第3章 融合多尺度多视角特征的食品图像识别
3.1 问题引出
3.2 模型设计及实现
3.2.1 多视角特征融合
3.2.1.1 中层属性特征
3.2.1.2 高层语义特征
3.2.1.3 深度视觉特征
3.2.2 多尺度特征融合
3.2.3 多尺度多视角特征融合
3.2.4 分析
3.3 实验验证与分析
3.3.1 实验数据
3.3.2 评测指标
3.3.3 实现细节
3.3.4 性能分析
3.3.4.1 ETH Food-101的性能分析
3.3.4.2 VireoFood-172和ChineseFoodNet的性能分析
3.3.5 讨论
3.4 小结
第4章 基于级联多注意力网络的食品图像识别
4.1 问题引出
4.2 ISIA Food-200数据集构建
4.3 模型设计和实现
4.3.1 类别信息监督的注意力子网络
4.3.2 食材信息监督的注意力子网络
4.3.3 多注意力机制网络
4.3.4 多任务学习
4.3.5 多尺度联合表示
4.4 实验验证与分析
4.4.1 实验数据
4.4.2 评测指标
4.4.3 实现细节
4.4.4 性能对比
4.4.5 定性分析和可视化
4.4.6 讨论
4.5 小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果
【参考文献】:
期刊论文
[1]融合三元卷积神经网络与关系网络的小样本食品图像识别[J]. 吕永强,闵巍庆,段华,蒋树强. 计算机科学. 2020(01)
本文编号:3203069
【文章来源】:中国科学院大学(中国科学院大学人工智能学院)北京市
【文章页数】:77 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 技术挑战
1.3 本文的研究内容与主要贡献
1.3.1 本文的研究内容
1.3.2 本文的主要贡献
1.4 论文结构安排
第2章 研究现状概述
2.1 单标签食品图像识别
2.2 多标签食品图像识别
2.3 面向移动端的食品图像识别
2.4 融入上下文信息的食品图像识别
2.5 小结
第3章 融合多尺度多视角特征的食品图像识别
3.1 问题引出
3.2 模型设计及实现
3.2.1 多视角特征融合
3.2.1.1 中层属性特征
3.2.1.2 高层语义特征
3.2.1.3 深度视觉特征
3.2.2 多尺度特征融合
3.2.3 多尺度多视角特征融合
3.2.4 分析
3.3 实验验证与分析
3.3.1 实验数据
3.3.2 评测指标
3.3.3 实现细节
3.3.4 性能分析
3.3.4.1 ETH Food-101的性能分析
3.3.4.2 VireoFood-172和ChineseFoodNet的性能分析
3.3.5 讨论
3.4 小结
第4章 基于级联多注意力网络的食品图像识别
4.1 问题引出
4.2 ISIA Food-200数据集构建
4.3 模型设计和实现
4.3.1 类别信息监督的注意力子网络
4.3.2 食材信息监督的注意力子网络
4.3.3 多注意力机制网络
4.3.4 多任务学习
4.3.5 多尺度联合表示
4.4 实验验证与分析
4.4.1 实验数据
4.4.2 评测指标
4.4.3 实现细节
4.4.4 性能对比
4.4.5 定性分析和可视化
4.4.6 讨论
4.5 小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
作者简历及攻读学位期间发表的学术论文与研究成果
【参考文献】:
期刊论文
[1]融合三元卷积神经网络与关系网络的小样本食品图像识别[J]. 吕永强,闵巍庆,段华,蒋树强. 计算机科学. 2020(01)
本文编号:3203069
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3203069.html
最近更新
教材专著