基于目标语义和外观深度特征融合的场景识别方法研究
发布时间:2021-07-23 13:38
场景识别技术作为机器视觉领域中的关键技术之一,已经发展成为深度学习方向的重要研究问题之一,与此同时也是图像识别领域的一个研究技术难点。如果能够有效地提高场景图像的识别率,将极大程度地推动人机交互、视频和图像检索、智能视频监控等领域的发展并且能够带来巨大的经济效益。因此,有效提高场景识别技术具有十分重要的意义和挑战性。场景图像普遍存在照射角度、光照强度、形状改变、部分遮挡和背景混入等情况,导致场景图像呈现类内差异大和类间差异小的特点。近年来,研究者做出了很多努力,来探寻有效的特征表示以提高场景的识别性能。在早期研究中,主要是利用先验知识设计用于提取场景图像的浅层视觉特征。这些浅层特征表示方法能够在早期的简单场景图像数据集上取得令人信服的结果。但是,针对那些更具挑战性的大型的场景识别数据库,则识别效果不佳。近年来,深度学习理论在计算机领域取得了有目共睹的巨大成功,基于深度特征的场景识别方法的性能普遍比基于浅层特征的方法要优越。研究发现场景图像的目标属性有助于提高场景图像的识别率,场景图像的目标语义特征属于高层特征。本人在前人的工作基础上,研究深度特征融合的场景识别算法。本文的主要研究内容如...
【文章来源】:南京邮电大学江苏省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
ImageNet数据集场景样本图
硕士研究生学位论文 据集[48]是一个室内场景数据集,有 67 个场景,包括:休闲场所,总共有 15620 张图像,所有图像在最小轴上的最部分图片如图 1.2 所示。
图 1.2 MIT67 数据集场景样本图据集9]是一个大型场景数据集,场景类别数为 899,共有 13N397 数据集,其中共含 397 个场景类别,一共有 108,75据集中 397 个良好采样的类别,其包含不同种类的室内场像如图 1.3 所示。
本文编号:3299394
【文章来源】:南京邮电大学江苏省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
ImageNet数据集场景样本图
硕士研究生学位论文 据集[48]是一个室内场景数据集,有 67 个场景,包括:休闲场所,总共有 15620 张图像,所有图像在最小轴上的最部分图片如图 1.2 所示。
图 1.2 MIT67 数据集场景样本图据集9]是一个大型场景数据集,场景类别数为 899,共有 13N397 数据集,其中共含 397 个场景类别,一共有 108,75据集中 397 个良好采样的类别,其包含不同种类的室内场像如图 1.3 所示。
本文编号:3299394
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3299394.html
最近更新
教材专著