基于卷积神经网络的多标签图像分类
发布时间:2021-01-23 10:54
针对BING算法对物体建模的不足,提出了multi-BING算法。该算法计算训练样本的CS-LBP特征,并对其进行聚类,对聚类后的数据建立BING模型。在物体检测过程中,融合了多个模型结果进行候选框判别,将多标签图像分类问题转化为多个单标签分类问题。以Fast R-CNN模型为基础,将采用本文物体检测方法得到的候选框作为模型输入。同时,采用LReLU函数作为Fast R-CNN模型的激活函数,从而在几乎不增加计算复杂度的情况下,提高模型的平均准确率(AP)。实验表明,本文方法优于BING算法和OBN算法。
【文章来源】:吉林大学学报(工学版). 2020,50(03)北大核心
【文章页数】:8 页
【部分图文】:
物体与非物体比较
(3)输出部分。该部分有两个分支:一个用于图像分类;一个用于窗口回归。分类输出为N+1维的向量,包括1类背景和N类待分类的物体。窗口回归输出一个4×N维的向量,输出修正后的预测窗口坐标。假定在图像中标注了一个正样本,其类别为u,回归窗口目标为v=(vx,vy,vw,vh),vx、vy分别为目标窗口在x、y方向的起始位置,vw、vh分别为预测窗口的宽度和高度。对其预测为类别u,概率为pu,预测窗口目标为tu=(txu,tyu,twu,thu),txu、tyu分别为预测窗口在x、y方向的起始位置,twu、thu分别为预测窗口的宽度和高度。则多任务损失函数为:
由式(6)可以看出,函数输出具有非负特性。输入小于0时,输出为0,会抑制对应神经元,使其参数不再更新,从而变成死节点。有研究表明,利用ReLU激活函数,在最坏情况下会使近半神经元成为死节点。因此,Maas等[6]提出了LReLU激活函数,如图5所示。与ReLU函数一样,当输入大于0时,LReLU函数原值输出;当输入小于0时,其输出为输入的α倍,而不是0,α为数值较小的一个常值系数。经过这样处理,较弱神经元得以保留,不会变成死节点,同时起到了增加神经元数量和修正分数分布的作用。LReLU激活函数的表达式为:式中:α=0.01。
【参考文献】:
期刊论文
[1]加权自适应CS-LBP与局部判别映射相结合的掌纹识别方法[J]. 张善文,张晴晴,张云龙,齐国红. 计算机应用研究. 2017(11)
[2]基于K均值聚类和区域匹配的颜色迁移技术[J]. 张子迎,周明全,税午阳,武仲科,郑霞. 系统仿真学报. 2015(10)
本文编号:2995089
【文章来源】:吉林大学学报(工学版). 2020,50(03)北大核心
【文章页数】:8 页
【部分图文】:
物体与非物体比较
(3)输出部分。该部分有两个分支:一个用于图像分类;一个用于窗口回归。分类输出为N+1维的向量,包括1类背景和N类待分类的物体。窗口回归输出一个4×N维的向量,输出修正后的预测窗口坐标。假定在图像中标注了一个正样本,其类别为u,回归窗口目标为v=(vx,vy,vw,vh),vx、vy分别为目标窗口在x、y方向的起始位置,vw、vh分别为预测窗口的宽度和高度。对其预测为类别u,概率为pu,预测窗口目标为tu=(txu,tyu,twu,thu),txu、tyu分别为预测窗口在x、y方向的起始位置,twu、thu分别为预测窗口的宽度和高度。则多任务损失函数为:
由式(6)可以看出,函数输出具有非负特性。输入小于0时,输出为0,会抑制对应神经元,使其参数不再更新,从而变成死节点。有研究表明,利用ReLU激活函数,在最坏情况下会使近半神经元成为死节点。因此,Maas等[6]提出了LReLU激活函数,如图5所示。与ReLU函数一样,当输入大于0时,LReLU函数原值输出;当输入小于0时,其输出为输入的α倍,而不是0,α为数值较小的一个常值系数。经过这样处理,较弱神经元得以保留,不会变成死节点,同时起到了增加神经元数量和修正分数分布的作用。LReLU激活函数的表达式为:式中:α=0.01。
【参考文献】:
期刊论文
[1]加权自适应CS-LBP与局部判别映射相结合的掌纹识别方法[J]. 张善文,张晴晴,张云龙,齐国红. 计算机应用研究. 2017(11)
[2]基于K均值聚类和区域匹配的颜色迁移技术[J]. 张子迎,周明全,税午阳,武仲科,郑霞. 系统仿真学报. 2015(10)
本文编号:2995089
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2995089.html