基于特征标记依赖的图像分类算法及实现
发布时间:2021-01-20 16:20
随着机器学习人工智能的快速兴起,传统的单标记已经难以准确的描述对象,多标记学习逐渐成为大家研究的热点。在多标记学习框架下,有用的数据越多,对于对象的描述就更加的准确。但是随着信息的不断增加,冗余的信息也会随之增加并且严重影响最后对于对象的描述与判断。特征提取就是一种处理数据高维性的一种有效的方法,通过对于原始的特征空间,过滤掉一些冗余或者无关的信息,选择出一组包含了原始特征空间全部或大部分有效信息的特征子集。但目前已有的多标记特征提取算法很少有充分利用特征信息并充分提取“特征-标记”独立信息及融合信息。而图像分类中关键点的特征提取直接影响到分类的效果。在上述特征提取研究基础上,我们进一步思考了零样本图像的分类问题。众所周知,图像分类问题就是虽然一直是计算机视觉领域的一大研究热点,但传统模型只能对已见过的对象进行分类,面对没有训练集的样本却毫无办法。因此零样本学习被提出来解决模型中出现的未见过对象。目前已有的零样本学习算法大多是对图像特征映射与语义向量映射的改进,或者是利用生成式对抗网络,将零样本图像分类任务转化为传统图像分类。但是以上的方法都没有考虑到原始数据集中特征与标记之间的信息。...
【文章来源】: 李志伟 安庆师范大学
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
AP趋势图
21采用显著性水平为5%的Friedmantest[60]。当两个算法在所有数据集上的平均排序的差值不大于临界差(CriticalDifference,CD),则认为这两个算法没有显著性差异,反之则有显著性差异。图3.2给出了所有算法在不同评价指标上的比较,坐标轴画出了各种算法的平均排序,坐标轴的数字表示平均排序,数字越小则说明平均排序越低,各评价指标子图中从左到右,算法性能依次降低。通过线段连接的两种算法表示在性能上没有显著差异。根据公式(3-26)可计算出CD值为2.2052。=()(3-26)(a)海明损失(b)1-错误率(c)覆盖率(d)排序损失(e)平均精度图3.2算法性能比较对某个任意算法,都有30个结果作为对比(在5个评价指标上具有6个对比算法),通过图3.2可以得出:(1)MIMLFE在5个评价指标上与其他6个对比算法相比时排序均为第一。(2)在HammingLoss、Coverage和RankingLoss三个评价指标上,MIMLFE与MDDMp和MVMD均无显著性差异,但均优于OS、MLSI、PCA、wMLDA。(3)在One-
27图4.1结合CRnet流程图4.4实验设置及结果分析4.4.1实验数据集及参数设置本文实验采用了五种零样本学习中最为常见的数据集,分别是是AwA1(AnimalswithAttributes1),AwA2(AnimalswithAttributes2),CUB(CaltechUCSDBirds200),SUN(SUNSceneRecognition)以及aPY(AttributePascalandYahoo)。AwA数据集是零样本学习中最常见的数据集,Lampert,Nickisch等使用50种动物类别作为关键字,并使用四个搜索引擎Google,Bing,Yahoo和Flickr搜索它们的图片。获得18万张照片后,消除了异常图像和重复图像。经过该预处理后,整个数据集共有30475张图片,共有50个类别,而对于每个类别,至少有92张图片。同时,每个动物类都有自己的属性,每个类共有85个属性。通过将采集到的图像与语义属性表相结合,可以将AwA数据集应用到任何一个使用属性知识的模型中,在分类实验中学习和利用属性知识。因为AwA应用的广泛性,Xian更新了AwA并创建了AwA2。AwA2数据集中有37322张图像,类和属性的数量和内容没有变化。CUB数据集是由加州理工学院创建的鸟类数据集,共有11788张图像,使用312个属性特征来描述200种不同的鸟类。aPY数据集由Farhadi等人组织。有两个部分,一个是PascalVOC2008数据集的一个子集共有12695张图片作为训练集,另一个是在雅虎上搜集的2644张图片测试集。此外,两部分的类不相互重叠,所以数据集完全满足零样本学习的实验要求。SUN数据集包含了细粒度的场景类和详细的属性标注,也可以应用于场景识别领域的零镜头学习。为了实验结果的准确有效性,我们使用从ImageNet预先训练的resnet-101提取的2048维特征,对于数据集中可见类与非可见类的划分均是按照论文[73]划分的并且和大部分其他零样本学习方法一致。对于各个数据集的参数配置也与CRnet
【参考文献】:
期刊论文
[1]联合嵌入式多标签分类算法[J]. 刘慧婷,冷新杨,王利利,赵鹏. 自动化学报. 2019(10)
[2]机器学习在医疗和公共卫生中应用[J]. 张景奇,史文宝,纪秀娟. 中国公共卫生. 2019(10)
[3]零样本学习研究进展[J]. 张鲁宁,左信,刘建伟. 自动化学报. 2020(01)
[4]弹性网络核极限学习机的多标记学习算法[J]. 王一宾,裴根生,程玉胜. 智能系统学报. 2019(04)
[5]非平衡化标签补全核极限学习机多标签学习[J]. 程玉胜,赵大卫,王一宾,裴根生. 电子学报. 2019(03)
[6]蝴蝶种类自动识别研究[J]. 谢娟英,侯琦,史颖欢,吕鹏,景丽萍,庄福振,张军平,谭晓阳,许升全. 计算机研究与发展. 2018(08)
[7]回归核极限学习机的多标记学习算法[J]. 王一宾,程玉胜,何月,裴根生. 模式识别与人工智能. 2018(05)
[8]结合深度特征与多标记分类的图像语义标注[J]. 李志欣,郑永哲,张灿龙,史忠植. 计算机辅助设计与图形学学报. 2018(02)
[9]基于信息粒化的多标记特征选择算法[J]. 王晨曦,林耀进,唐莉,傅为,林培榕. 模式识别与人工智能. 2018(02)
[10]基于ReliefF剪枝的多标记分类算法[J]. 刘海洋,王志海,张志东. 计算机学报. 2019(03)
本文编号:2989369
【文章来源】: 李志伟 安庆师范大学
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
AP趋势图
21采用显著性水平为5%的Friedmantest[60]。当两个算法在所有数据集上的平均排序的差值不大于临界差(CriticalDifference,CD),则认为这两个算法没有显著性差异,反之则有显著性差异。图3.2给出了所有算法在不同评价指标上的比较,坐标轴画出了各种算法的平均排序,坐标轴的数字表示平均排序,数字越小则说明平均排序越低,各评价指标子图中从左到右,算法性能依次降低。通过线段连接的两种算法表示在性能上没有显著差异。根据公式(3-26)可计算出CD值为2.2052。=()(3-26)(a)海明损失(b)1-错误率(c)覆盖率(d)排序损失(e)平均精度图3.2算法性能比较对某个任意算法,都有30个结果作为对比(在5个评价指标上具有6个对比算法),通过图3.2可以得出:(1)MIMLFE在5个评价指标上与其他6个对比算法相比时排序均为第一。(2)在HammingLoss、Coverage和RankingLoss三个评价指标上,MIMLFE与MDDMp和MVMD均无显著性差异,但均优于OS、MLSI、PCA、wMLDA。(3)在One-
27图4.1结合CRnet流程图4.4实验设置及结果分析4.4.1实验数据集及参数设置本文实验采用了五种零样本学习中最为常见的数据集,分别是是AwA1(AnimalswithAttributes1),AwA2(AnimalswithAttributes2),CUB(CaltechUCSDBirds200),SUN(SUNSceneRecognition)以及aPY(AttributePascalandYahoo)。AwA数据集是零样本学习中最常见的数据集,Lampert,Nickisch等使用50种动物类别作为关键字,并使用四个搜索引擎Google,Bing,Yahoo和Flickr搜索它们的图片。获得18万张照片后,消除了异常图像和重复图像。经过该预处理后,整个数据集共有30475张图片,共有50个类别,而对于每个类别,至少有92张图片。同时,每个动物类都有自己的属性,每个类共有85个属性。通过将采集到的图像与语义属性表相结合,可以将AwA数据集应用到任何一个使用属性知识的模型中,在分类实验中学习和利用属性知识。因为AwA应用的广泛性,Xian更新了AwA并创建了AwA2。AwA2数据集中有37322张图像,类和属性的数量和内容没有变化。CUB数据集是由加州理工学院创建的鸟类数据集,共有11788张图像,使用312个属性特征来描述200种不同的鸟类。aPY数据集由Farhadi等人组织。有两个部分,一个是PascalVOC2008数据集的一个子集共有12695张图片作为训练集,另一个是在雅虎上搜集的2644张图片测试集。此外,两部分的类不相互重叠,所以数据集完全满足零样本学习的实验要求。SUN数据集包含了细粒度的场景类和详细的属性标注,也可以应用于场景识别领域的零镜头学习。为了实验结果的准确有效性,我们使用从ImageNet预先训练的resnet-101提取的2048维特征,对于数据集中可见类与非可见类的划分均是按照论文[73]划分的并且和大部分其他零样本学习方法一致。对于各个数据集的参数配置也与CRnet
【参考文献】:
期刊论文
[1]联合嵌入式多标签分类算法[J]. 刘慧婷,冷新杨,王利利,赵鹏. 自动化学报. 2019(10)
[2]机器学习在医疗和公共卫生中应用[J]. 张景奇,史文宝,纪秀娟. 中国公共卫生. 2019(10)
[3]零样本学习研究进展[J]. 张鲁宁,左信,刘建伟. 自动化学报. 2020(01)
[4]弹性网络核极限学习机的多标记学习算法[J]. 王一宾,裴根生,程玉胜. 智能系统学报. 2019(04)
[5]非平衡化标签补全核极限学习机多标签学习[J]. 程玉胜,赵大卫,王一宾,裴根生. 电子学报. 2019(03)
[6]蝴蝶种类自动识别研究[J]. 谢娟英,侯琦,史颖欢,吕鹏,景丽萍,庄福振,张军平,谭晓阳,许升全. 计算机研究与发展. 2018(08)
[7]回归核极限学习机的多标记学习算法[J]. 王一宾,程玉胜,何月,裴根生. 模式识别与人工智能. 2018(05)
[8]结合深度特征与多标记分类的图像语义标注[J]. 李志欣,郑永哲,张灿龙,史忠植. 计算机辅助设计与图形学学报. 2018(02)
[9]基于信息粒化的多标记特征选择算法[J]. 王晨曦,林耀进,唐莉,傅为,林培榕. 模式识别与人工智能. 2018(02)
[10]基于ReliefF剪枝的多标记分类算法[J]. 刘海洋,王志海,张志东. 计算机学报. 2019(03)
本文编号:2989369
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2989369.html