当前位置:主页 > 管理论文 > 统计学论文 >

非平衡化标记补全的多标记学习及其应用

发布时间:2020-06-12 19:03
【摘要】:多标记学习是处理真实世界具有丰富语义对象的主要学习框架之一。在人工智能、机器学习等方面应用广泛。在多标记学习中,示例具有多种标记属性,而这些标记间存在局部或者全局的相关性。显然合理利用标记间的这种关系可以获得额外的分类信息,这有利于提高多标记学习系统的性能。在真实世界中,样本的标记数通常远小于未标记数,否则示例的多义性将失去意义。但不可否认的是未知标记中也可能包含了大量有价值信息。目前很多考虑标记相关性学习算法都是假定标记间相关性是对称的,然而标记间关系并非一定对称。基于以上考虑,本文展开研究,主要工作如下:(1)目前众多的研究者通常直接将标签置信度矩阵作为先验知识直接加入到分类模型中,并没有考虑未标注先验知识对标签集质量的影响。基于此提出一种非平衡化标记补全的核极限学习机多标记学习算法:首先使用信息熵计算标记之间的相关关系得到标记置信度矩阵,然后利用非平衡参数方法对基础的标记置信度矩阵进行改进,构建出一个非平衡的标记补全矩阵,最后为了学习获得更加准确的标记置信度矩阵,将非平衡化的标记补全矩阵与核极限学习机进行联合学习,依此来解决多标记分类问题。(2)针对近邻空间的标记相关性问题,利用近邻空间中元素的相关性提升近邻标记空间的质量,提出一种近邻标记空间的非平衡化标记补全算法:首先利用标记之间的信息熵来衡量标记之间关系的强弱,进而获得基础标记置信度矩阵;然后利用提出的非平衡标记置信度矩阵计算方法,获得包含更多信息的非平衡标记置信度矩阵;接下来度量样本在特征空间中的相似度,得到k个近邻标记空间样本,再利用非平衡标记置信度矩阵计算得到近邻标记空间的标记补全矩阵,最后利用极限学习机作为线性分类器进行分类。(3)考虑样本特征空间信息进行重构,增强特征空间的样本联系的同时引入标记相关性信息,提出一种结合均值漂移和非平衡化标记补全的多标记学习算法:首先利用均值漂移聚类方法将特征空间中特征间的信息进行重构;接着利用标记之间的信息熵来衡量标记之间关系的强弱,进而获得基础标记置信度矩阵;然后利用提出的非平衡标记置信度矩阵计算方法,获得包含更多信息的非平衡化标记补全矩阵;最后利用重构的特征空间与非平衡化的标记补全矩阵构成新的训练集,根据新的训练集采用已有的线性分类器进行预测。
【图文】:

性能比较图,性能比较,算法


下优于其他算法。④ 对于 ML-KNN 算法,72%情况下,,在统计上与其他算法没有显著差异;在况下优于其他算法。从上述分析可知,KELM-NeLC 算法性能最优,在 68%的情况下,在统计上优于算法,其次是 LIFT 算法,在 36%的水平下,在统计上优于其它算法,第三是 RE法,在 16%的水平下优于其它算法。以上实验进一步地说明了 KELM-NeLC 算法的有效性,标记间相关关系语义的合。

多标记,评估指标,数据集,指数


32(e)RL图 4.2 不同评估指标下的基准多标记数据集测试的稳定性指数4.5 本章小结在多标记分类学习中,近邻标记空间中引入对标记相关性的研究可以提升分类器分类性能,为了充分利用这一关系本章引入了非平衡参数,本章提出了一种近邻标记空间的非平衡化标记补全算法 NeLC-NLS。将非平衡化标记置信度矩阵与近邻标记空间结合,提升了近邻标记空间的质量,并将其统一在一个学习框架下。实验结果表明,NeLC-NLS 算法优于一些常见的多标记学习算法。
【学位授予单位】:安庆师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C81

【参考文献】

相关期刊论文 前4条

1 何志芬;杨明;刘会东;;多标记分类和标记相关性的联合学习[J];软件学报;2014年09期

2 张振海;李士宁;李志刚;陈昊;;一类基于信息熵的多标签特征选择算法[J];计算机研究与发展;2013年06期

3 张敏灵;;一种新型多标记懒惰学习算法[J];计算机研究与发展;2012年11期

4 邓万宇;郑庆华;陈琳;许学斌;;神经网络极速学习方法研究[J];计算机学报;2010年02期

相关硕士学位论文 前1条

1 殷洪峰;基于标签相关性的多标签分类算法及其在帕金森诊疗领域中的应用[D];南京大学;2017年



本文编号:2709965

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2709965.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户55ed6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com