当前位置:主页 > 科技论文 > 自动化论文 >

基于卷积神经网络的多标签图像分类

发布时间:2021-01-23 10:54
  针对BING算法对物体建模的不足,提出了multi-BING算法。该算法计算训练样本的CS-LBP特征,并对其进行聚类,对聚类后的数据建立BING模型。在物体检测过程中,融合了多个模型结果进行候选框判别,将多标签图像分类问题转化为多个单标签分类问题。以Fast R-CNN模型为基础,将采用本文物体检测方法得到的候选框作为模型输入。同时,采用LReLU函数作为Fast R-CNN模型的激活函数,从而在几乎不增加计算复杂度的情况下,提高模型的平均准确率(AP)。实验表明,本文方法优于BING算法和OBN算法。 

【文章来源】:吉林大学学报(工学版). 2020,50(03)北大核心

【文章页数】:8 页

【部分图文】:

基于卷积神经网络的多标签图像分类


物体与非物体比较

模型结构,目标,类别


(3)输出部分。该部分有两个分支:一个用于图像分类;一个用于窗口回归。分类输出为N+1维的向量,包括1类背景和N类待分类的物体。窗口回归输出一个4×N维的向量,输出修正后的预测窗口坐标。假定在图像中标注了一个正样本,其类别为u,回归窗口目标为v=(vx,vy,vw,vh),vx、vy分别为目标窗口在x、y方向的起始位置,vw、vh分别为预测窗口的宽度和高度。对其预测为类别u,概率为pu,预测窗口目标为tu=(txu,tyu,twu,thu),txu、tyu分别为预测窗口在x、y方向的起始位置,twu、thu分别为预测窗口的宽度和高度。则多任务损失函数为:

函数曲线,函数曲线,函数,激活函数


由式(6)可以看出,函数输出具有非负特性。输入小于0时,输出为0,会抑制对应神经元,使其参数不再更新,从而变成死节点。有研究表明,利用ReLU激活函数,在最坏情况下会使近半神经元成为死节点。因此,Maas等[6]提出了LReLU激活函数,如图5所示。与ReLU函数一样,当输入大于0时,LReLU函数原值输出;当输入小于0时,其输出为输入的α倍,而不是0,α为数值较小的一个常值系数。经过这样处理,较弱神经元得以保留,不会变成死节点,同时起到了增加神经元数量和修正分数分布的作用。LReLU激活函数的表达式为:式中:α=0.01。

【参考文献】:
期刊论文
[1]加权自适应CS-LBP与局部判别映射相结合的掌纹识别方法[J]. 张善文,张晴晴,张云龙,齐国红.  计算机应用研究. 2017(11)
[2]基于K均值聚类和区域匹配的颜色迁移技术[J]. 张子迎,周明全,税午阳,武仲科,郑霞.  系统仿真学报. 2015(10)



本文编号:2995089

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2995089.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户64c98***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com