基于蒙特卡罗数据集均衡与鲁棒性增量极限学习机的图像自动标注
发布时间:2019-07-17 15:23
【摘要】:针对传统图像标注模型存在着训练时间长、对低频词汇敏感等问题,该文提出了基于蒙特卡罗数据集均衡和鲁棒性增量极限学习机的图像自动标注模型.该模型首先对公共图像库的训练集数据进行图像自动分割,选择分割后相应的种子标注词,并通过提出的基于综合距离的图像特征匹配算法进行自动匹配以形成不同类别的训练集.针对公共数据库中不同标注词的数据规模相差较大,提出了蒙特卡罗数据集均衡算法使得各个标注词间的数据规模大体一致.然后针对单一特征描述存在的不足,提出了多尺度特征融合算法对不同标注词图像进行有效的特征提取.最后针对传统极限学习机存在的隐层节点随机性和输入向量权重一致性的问题,提出了鲁棒性增量极限学习,提高了判别模型的准确性.通过在公共数据集上的实验结果表明:该模型可以在很短时间内实现图像的自动标注,对低频词汇具有较强的鲁棒性,并且在平均召回率、平均准确率、综合值等多项指标上均高于现流行的大多数图像自动标注模型.
文内图片:
图片说明: 电子学报2017年从图中可以看出,图像库中不同类别的标注词之间所关联的图像集,其数据规模具有较大的差别,例如water标注词与其关联的图像有1000多张,lake,crab等标注词与其关联的图像只有10来张.相互之间的数据集规模相差从几倍到上百倍不等,这样想要构建出一个合理的分类模型是相当困难的.例如在训练集中出现词频较高的关键词sky,water,people,tree往往能够获得较好的标注准确率和召回率,而在训练集中词频出现较少的关键词,,例如butterfly,crab甚至一次标注正确的都没有.本文提出蒙特卡罗数据集均衡算法(MC-BDS),使得均衡之后的各个不同类别之间的数据集规模大致平衡或者之间差别较小.本文采用加权复合特征距离作为图像扩充的准则,以下为部分标注词其加权复合特征距离的分布情况.表1不同标注词的加权复合特征距离标注词名称加权复合特征距离下限加权复合特征距离上限city5.67826.9325bear11.635612.7411mountain6.82177.6452cat12.364113.2829sun9.241810.6722butterfly14.202516.7318lake10.632511.7187crab17.215018.6336hats13.370214.1923由表1可知:不同标注词之间的加权复合特征距离具有一定差异性.有部分不同类别的标注词之间的加权复合特征距离上限和下限可能会存在少部分的重叠,但是并不会影响到数据集的均衡扩充.其原因主要有以下两点:(1)本文中提出的数据均衡扩充算法(MC-BDS),其扩充的数据的加权复合特征距离是均匀分布在其类别的下限和上限之间,不会集中在下限领域或者上限领域,因此能保证扩充之后的数据的特征距离,能够较大程度上远离重叠区域.(2)假设标注词A的特征为XA={x1,x2…….xm},新样本的特征的产生是基于原始样本,也就是说新产生
文内图片:
图片说明: 电子学报2017年从图中可以看出,图像库中不同类别的标注词之间所关联的图像集,其数据规模具有较大的差别,例如water标注词与其关联的图像有1000多张,lake,crab等标注词与其关联的图像只有10来张.相互之间的数据集规模相差从几倍到上百倍不等,这样想要构建出一个合理的分类模型是相当困难的.例如在训练集中出现词频较高的关键词sky,water,people,tree往往能够获得较好的标注准确率和召回率,而在训练集中词频出现较少的关键词,例如butterfly,crab甚至一次标注正确的都没有.本文提出蒙特卡罗数据集均衡算法(MC-BDS),使得均衡之后的各个不同类别之间的数据集规模大致平衡或者之间差别较小.本文采用加权复合特征距离作为图像扩充的准则,以下为部分标注词其加权复合特征距离的分布情况.表1不同标注词的加权复合特征距离标注词名称加权复合特征距离下限加权复合特征距离上限city5.67826.9325bear11.635612.7411mountain6.82177.6452cat12.364113.2829sun9.241810.6722butterfly14.202516.7318lake10.632511.7187crab17.215018.6336hats13.370214.1923由表1可知:不同标注词之间的加权复合特征距离具有一定差异性.有部分不同类别的标注词之间的加权复合特征距离上限和下限可能会存在少部分的重叠,但是并不会影响到数据集的均衡扩充.其原因主要有以下两点:(1)本文中提出的数据均衡扩充算法(MC-BDS),其扩充的数据的加权复合特征距离是均匀分布在其类别的下限和上限之间,不会集中在下限领域或者上限领域,因此能保证扩充之后的数据的特征距离,能够较大程度上远离重叠区域.(2)假设标注词A的特征为XA={x1,x2…….xm},新样本的特征的产生是基于原始样本,也就是说新产生
【作者单位】: 福州大学数学与计算机科学学院;福建省网络计算与智能信息处理重点实验室(福州大学);
【基金】:国家自然科学基金(No.61502105) 福建省科技引导性项目(No.2017H0015) 福建省中青年教师教育科研项目(No.JA15075)
【分类号】:TP18;TP391.41
文内图片:
图片说明: 电子学报2017年从图中可以看出,图像库中不同类别的标注词之间所关联的图像集,其数据规模具有较大的差别,例如water标注词与其关联的图像有1000多张,lake,crab等标注词与其关联的图像只有10来张.相互之间的数据集规模相差从几倍到上百倍不等,这样想要构建出一个合理的分类模型是相当困难的.例如在训练集中出现词频较高的关键词sky,water,people,tree往往能够获得较好的标注准确率和召回率,而在训练集中词频出现较少的关键词,,例如butterfly,crab甚至一次标注正确的都没有.本文提出蒙特卡罗数据集均衡算法(MC-BDS),使得均衡之后的各个不同类别之间的数据集规模大致平衡或者之间差别较小.本文采用加权复合特征距离作为图像扩充的准则,以下为部分标注词其加权复合特征距离的分布情况.表1不同标注词的加权复合特征距离标注词名称加权复合特征距离下限加权复合特征距离上限city5.67826.9325bear11.635612.7411mountain6.82177.6452cat12.364113.2829sun9.241810.6722butterfly14.202516.7318lake10.632511.7187crab17.215018.6336hats13.370214.1923由表1可知:不同标注词之间的加权复合特征距离具有一定差异性.有部分不同类别的标注词之间的加权复合特征距离上限和下限可能会存在少部分的重叠,但是并不会影响到数据集的均衡扩充.其原因主要有以下两点:(1)本文中提出的数据均衡扩充算法(MC-BDS),其扩充的数据的加权复合特征距离是均匀分布在其类别的下限和上限之间,不会集中在下限领域或者上限领域,因此能保证扩充之后的数据的特征距离,能够较大程度上远离重叠区域.(2)假设标注词A的特征为XA={x1,x2…….xm},新样本的特征的产生是基于原始样本,也就是说新产生
文内图片:
图片说明: 电子学报2017年从图中可以看出,图像库中不同类别的标注词之间所关联的图像集,其数据规模具有较大的差别,例如water标注词与其关联的图像有1000多张,lake,crab等标注词与其关联的图像只有10来张.相互之间的数据集规模相差从几倍到上百倍不等,这样想要构建出一个合理的分类模型是相当困难的.例如在训练集中出现词频较高的关键词sky,water,people,tree往往能够获得较好的标注准确率和召回率,而在训练集中词频出现较少的关键词,例如butterfly,crab甚至一次标注正确的都没有.本文提出蒙特卡罗数据集均衡算法(MC-BDS),使得均衡之后的各个不同类别之间的数据集规模大致平衡或者之间差别较小.本文采用加权复合特征距离作为图像扩充的准则,以下为部分标注词其加权复合特征距离的分布情况.表1不同标注词的加权复合特征距离标注词名称加权复合特征距离下限加权复合特征距离上限city5.67826.9325bear11.635612.7411mountain6.82177.6452cat12.364113.2829sun9.241810.6722butterfly14.202516.7318lake10.632511.7187crab17.215018.6336hats13.370214.1923由表1可知:不同标注词之间的加权复合特征距离具有一定差异性.有部分不同类别的标注词之间的加权复合特征距离上限和下限可能会存在少部分的重叠,但是并不会影响到数据集的均衡扩充.其原因主要有以下两点:(1)本文中提出的数据均衡扩充算法(MC-BDS),其扩充的数据的加权复合特征距离是均匀分布在其类别的下限和上限之间,不会集中在下限领域或者上限领域,因此能保证扩充之后的数据的特征距离,能够较大程度上远离重叠区域.(2)假设标注词A的特征为XA={x1,x2…….xm},新样本的特征的产生是基于原始样本,也就是说新产生
【作者单位】: 福州大学数学与计算机科学学院;福建省网络计算与智能信息处理重点实验室(福州大学);
【基金】:国家自然科学基金(No.61502105) 福建省科技引导性项目(No.2017H0015) 福建省中青年教师教育科研项目(No.JA15075)
【分类号】:TP18;TP391.41
【相似文献】
相关期刊论文 前10条
1 张学军;郭建;;图像纹理分析的方法与应用[J];黑龙江科技信息;2009年16期
2 孟勇,洪丹辉,毛丹;测度熵在图像纹理分析中的应用[J];计算机应用与软件;2000年08期
3 吴涛;秦昆;;图像纹理特征数据挖掘的理论与方法探讨[J];计算机时代;2006年08期
4 方玲玲;王相海;;图像挖掘研究[J];计算机科学;2009年08期
5 刘勇,施万昌,徐玉兰;图像差异的分析与识别[J];复旦学报(自然科学版);2000年05期
6 罗l
本文编号:2515513
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2515513.html