基于引力场模型的多标记特征选择
发布时间:2021-04-13 08:41
多标记学习在机器学习、人工智能等方面得到广泛的应用。在多标记学习框架下,为了更准确地描述对象,需要收集大量的特征数据,但随着特征数据的不断增加,冗余特征也随之增多,会直接影响分类器的精度并可能增加模型训练时间。特征选择是处理数据高维度问题的一种有效方法,其通过在原始特征空间中删除冗余或不相关特征选择出一组含有原始特征空间全部或大部分信息的特征子集。目前,大部分特征选择算法基本上都依据“最大相关性最小冗余性”这一准则进行特征选择,但这种方法通常忽略了特征之间可能存在的相互影响和作用。为考虑特征间的相互作用力,本文将排斥损失和万有引力应用到多标记特征选择上,将特征视为原子,特征间也存在引力作用或者排斥作用,并将这些作用力都视为引力场中的力。另外,上述方法选择特征子集都是基于整个特征空间在进行特征选择之前都已全部提前获取到。然而,在实际情况中,有些问题其特征空间和标记空间均呈现增量或动态的特点,如何处理这种动态环境下的流特征选择,值得进一步研究。针对上述问题,本文主要研究工作如下:(1)为考虑特征之间的作用力,借用物理磁极相互排斥吸引的原理,假设特征之间存在吸引或排斥力,并提出基于特征排斥损...
【文章来源】:安庆师范大学安徽省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
多标记示例
17图 3. 2 Health 数据集的各个评价指标的性能变化 3.3 至表 3.7 所示的实验结果,我们可以发现:于 Average Precision,Hamming Loss 和 Ranking Loss,可以发现在五个数据-FRL 的值达到最大值,即性能非常好。在数据集 Birds 上,FS-FRL 的 AP FNMIopt 的 AP 值低 0.007。根据 6 个数据集的平均排名结果,FS-FRL 排名现最佳.于 One Error,在六个数据集上,FS-FRL 在四个数据集上取得最优值。在数据集中,FS-FRL 获得的值与最优值之间的差异很小。例如,在 Cal500 ,MFNMIpes 是最优的,由 MFNMI 取得的海明损失值仅比 FS-FRL 取得的值低 0.004。于 Coverage,从表 3.7 中我们可以发现 FS-FRL 在四个数据集上取得最小 C,即性能最佳。FS-FRL 在六个数据集的综合排名中排名第一。
(e)CV图 3. 3 在 6 个多标记数据集上获得的稳定性指数值可以看出:(1)对于 Average Precision 和 On形,这意味着 FS-FRL 获得更稳定的解。并且。(2)对于 Hamming Loss 和 Ranking Loss定性,这表明算法 FS-FRL 具有很强的稳定性集上的稳定性指数在[0.38,0.5]之间达到相当稳 非常稳定。算法主要基于相关性和冗余性,但其忽略了特,本章利用邻域信息熵分别构造特征吸引项和损失的多标记特征选择算法。所提出的算法在在邻域模型的基础上,当样本数量较少时,如
【参考文献】:
期刊论文
[1]基于邻域粗糙集的多标记属性约简算法[J]. 陈盼盼,林梦雷,刘景华,林国平. 闽南师范大学学报(自然科学版). 2018(04)
[2]基于局部子空间的多标记特征选择算法[J]. 刘景华,林梦雷,王晨曦,林耀进. 模式识别与人工智能. 2016(03)
本文编号:3134983
【文章来源】:安庆师范大学安徽省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
多标记示例
17图 3. 2 Health 数据集的各个评价指标的性能变化 3.3 至表 3.7 所示的实验结果,我们可以发现:于 Average Precision,Hamming Loss 和 Ranking Loss,可以发现在五个数据-FRL 的值达到最大值,即性能非常好。在数据集 Birds 上,FS-FRL 的 AP FNMIopt 的 AP 值低 0.007。根据 6 个数据集的平均排名结果,FS-FRL 排名现最佳.于 One Error,在六个数据集上,FS-FRL 在四个数据集上取得最优值。在数据集中,FS-FRL 获得的值与最优值之间的差异很小。例如,在 Cal500 ,MFNMIpes 是最优的,由 MFNMI 取得的海明损失值仅比 FS-FRL 取得的值低 0.004。于 Coverage,从表 3.7 中我们可以发现 FS-FRL 在四个数据集上取得最小 C,即性能最佳。FS-FRL 在六个数据集的综合排名中排名第一。
(e)CV图 3. 3 在 6 个多标记数据集上获得的稳定性指数值可以看出:(1)对于 Average Precision 和 On形,这意味着 FS-FRL 获得更稳定的解。并且。(2)对于 Hamming Loss 和 Ranking Loss定性,这表明算法 FS-FRL 具有很强的稳定性集上的稳定性指数在[0.38,0.5]之间达到相当稳 非常稳定。算法主要基于相关性和冗余性,但其忽略了特,本章利用邻域信息熵分别构造特征吸引项和损失的多标记特征选择算法。所提出的算法在在邻域模型的基础上,当样本数量较少时,如
【参考文献】:
期刊论文
[1]基于邻域粗糙集的多标记属性约简算法[J]. 陈盼盼,林梦雷,刘景华,林国平. 闽南师范大学学报(自然科学版). 2018(04)
[2]基于局部子空间的多标记特征选择算法[J]. 刘景华,林梦雷,王晨曦,林耀进. 模式识别与人工智能. 2016(03)
本文编号:3134983
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3134983.html