基于融合语义和CapsNet的图像识别方法研究
发布时间:2024-02-19 23:29
图像识别指利用计算机对图像信息进行处理和分析,从而对图像中包含的目标类别进行划分。图像的识别具有非常广泛的应用,如指纹识别、人脸识别和交通标志识别等。现有的卷积神经网络图像识别方法,由于其具有强大的特征学习能力,在识别准确率上表现优异。但是,该类方法是基于数据驱动,存在样本需求量大,训练时间长,调参困难等缺陷。本论文主要研究并实现了一种融合语义和胶囊网络(Capsule Network,CapsNet)的图像识别方法。图像语义是指视觉接收图像信号形成的结构化知识描述,包含一系列可理解、可解释的信息。该方法通过融合图像的语义和CapsNet,提高训练数据的利用率,可在较少样本集训练的情况下,达到较好的识别效果。该方法可以有效缓解深度学习模型依赖大量训练样本的问题。具体工作内容如下:(1)本文提出一种基于语义的识别网络,模拟人对图像中不同类别目标的认知过程:依据不同类别的目标具有其特定的知识描述――语义,对目标进行分类识别。不同的语义之间具有一定的层级关系,图像中语义往往由若干子语义组成,子语义可以继续不断划分,直到不能拆解时称为语义基元,本文构建语义网络来描述语义基元与语义的关系,通过对...
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
本文编号:3903492
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图2.4德国交通标志中部分基元组合示例
视觉感知到图像中的基本信息,它是描述待测目标的基本组成部分,分析并确定基元的个数,对图像进行基元提取,获得语义信息。给出交通标志中部分基元组合形式如图2.4所示。图2.4德国交通标志中部分基元组合示例形如其中机动车禁止通行标志可以分解为红色的圆环和小车轮廓,通过识别图像中包含的红....
图3.6激活函数图形(3)池化层
0。常见激活函数图形如图3.6所示。30
图4.4胶囊网络损失函数图形
2范数归一化,指将向量中各元素的先平方后求和,再求平方根的过程。损失函数取值如图4.4所示。图4.4胶囊网络损失函数图形4.3.2语语义义模模型型损损失失函函数数设设计计语义模型的训练过程主要是,利用损失函数公式(4-3),计算与训练样本实际类别标签的损失值,这个损失值就是语义....
图4.5调节系数函数
调节系数函数(4-4)图形如图4.5所示。计算表达式中用来控制曲线变化的快慢程度,控制曲线起始变化的位置的左右。图4.5调节系数函数53
本文编号:3903492
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3903492.html
最近更新
教材专著