半监督多标记特征选择算法研究
发布时间:2021-04-14 23:23
在机器学习领域中,传统监督学习假设一个学习对象只对应一个概念标记。而在现实生活中,一个学习对象可能同时隶属于多个概念标记。比如,一部电影可以同时被标记为科幻、动作和美国等;一张图片也可能被同时标记为木屋、树木、草坪、小路等。多标记学习是研究此类问题的一种学习框架,受到许多研究者的青睐。然而,现有多标记学习算法存在两个问题:一方面,标记个数多且语义信息复杂,标注多标记数据需耗费大量人力和时间,难以获得大量已标记数据;另一方面,多标记数据集的特征呈现维数高的问题,无关、冗余特征将会损坏分类模型的泛化能力,因此,需要对高维多标记数据进行降维。本文针对上述两个问题提出了一种半监督多标记特征选择算法(semi-supervised multi-label feature selection,SSMLFS),其基本思想是在半监督学习框架下根据原始特征描述和与之相关的标记之间的依赖性和局部结构保持能力来评价特征,主要内容如下:首先,基于HSIC(Hilbert-Schmidt Independent Criterion),计算RKHS(Reproducing Kernel Hilbert Space...
【文章来源】:湖南师范大学湖南省 211工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
单标记图像与多标记图像对比
Human数据集性能对比图(Mean)
Medical数据集性能对比图(Mean)
本文编号:3138205
【文章来源】:湖南师范大学湖南省 211工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
单标记图像与多标记图像对比
Human数据集性能对比图(Mean)
Medical数据集性能对比图(Mean)
本文编号:3138205
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3138205.html