基于标签相关性和类不平衡性的多标签分类算法

发布时间:2021-05-18 12:38
  随着数据挖掘的发展,多标签分类如今已被广泛应用在文本分类、图像分类、生物信息学、信息检索以及视频处理等领域中。多标签分类对每个样本都学习一个或多个标签类别。而随着数据形式越来越复杂,标签数量越来越多,未知样本的可能标签集合数量也呈指数形式增长,即多标签分类面临输出空间规模巨大的问题。在实际问题中,标签类别在语义空间中往往具有相关性,如果在学习过程中能够充分考虑标签类别间的相关性,则在一定程度上能避免巨大输出空间问题,提高分类器的分类性能。同时,在分类数据集中,不同类别的样本数量往往相差很多,即多标签分类很可能面临类不平衡问题。如果在学习过程中忽略类不平衡问题,则可能会导致分类器最终的预测结果全部偏向样本数较多的类别,从而影响到分类性能。本文针对多标签分类展开相关的研究工作,提出基于标签相关性和类不平衡性的多标签分类算法MLCI(Multi-Label Classification Algorithm Based on Label Correlation and Class Imbalance)。主要的研究工作如下:(1)针对多标签分类的输出空间规模巨大问题,MLCI算法通过考虑标签的相... 

【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:74 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
主要符号表
第一章 绪论
    1.1 研究背景及意义
    1.2 研究现状
        1.2.1 多标签分类的应用领域
        1.2.2 基于标签相关性的多标签分类
        1.2.3 基于类不平衡性的多标签分类
    1.3 本文主要工作
    1.4 本文组织结构
第二章 相关知识综述
    2.1 多标签学习研究方向
    2.2 多标签分类算法
        2.2.1 问题转化方法
        2.2.2 算法适应方法
        2.2.3 集成学习方法
    2.3 标签相关性
    2.4 类不平衡性
    2.5 本章小结
第三章 结合标签相关性和类不平衡性的多标签分类算法
    3.1 多标签分类问题定义
    3.2 MLCI多标签分类算法设计
        3.2.1 MLCI多标签分类算法概述
        3.2.2 基于类不平衡的二分类器学习方法设计
        3.2.3 基于类不平衡的多类别分类器学习方法设计
        3.2.4 二分类器和多类别分类器的集成
    3.3 本章小结
第四章 实验与结果分析
    4.1 实验设置
    4.2 实验数据集
    4.3 实验评价指标
    4.4 实验对比算法
    4.5 实验结果分析
        4.5.1 不同评价指标下的实验结果分析
        4.5.2 不同数据集下的实验结果分析
        4.5.3 综合实验结果分析
    4.6 本章小结
第五章 总结与展望
    5.1 回顾和总结
    5.2 前景展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件


【参考文献】:
硕士论文
[1]基于标签相关性的KNN多标签分类方法研究[D]. 檀何凤.安徽大学 2015



本文编号:3193803

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3193803.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户07b1d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com