基于多标签学习的特征降维和文本分类方法研究

发布时间:2021-05-25 17:43
  随着互联网时代下网络信息的爆炸式增长,多标签文本分类已经成为处理文本信息数据的一种有效手段。信息数据可以通过多标签文本分类快速准确地定位到所属类别,多标签文本分类算法渐渐成为自然语言处理领域的研究热点。但是目前的多标签分类算法还存在着数据的类不平衡和计算复杂度高的问题,而且通过网络产生的多标签数据存在特征维度高、数据复杂等特点,当直接用于分类任务时,容易对分类效率和分类准确率产生影响。基于这些问题,本文对多标签文本特征降维方法和分类算法进行研究,分别改进出基于Kullback-Leibler散度依赖性最大化的多标签降维方法和基于引力的多标签文本分类模型。针对多标签分类过程中多标签数据的高维特征会导致计算难度大和分类效率低等问题,通过对基于依赖性最大化的降维方法进行改进,得出一种基于Kullback-Leibler散度依赖性最大化的多标签降维方法。在分类过程的特征降维阶段,将原始矩阵映射到低维空间中并通过Kullback-Leibler散度最大化原始特征描述与类标签之间的依赖性,由于不需要特征分解,使得计算量得到很大降低。实验结果表明该降维方法能够有效进行多标签数据降维,提高了分类效率。... 

【文章来源】:重庆邮电大学重庆市

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
注释表
第1章 绪论
    1.1 课题研究背景及意义
    1.2 多标签分类
    1.3 课题研究现状及分析
        1.3.1 国内外研究现状
        1.3.2 存在的问题
    1.4 论文主要工作及组织结构
        1.4.1 论文的研究内容
        1.4.2 论文的结构安排
    1.5 本章小结
第2章 多标签文本分类相关技术
    2.1 文本分类的相关知识
        2.1.1 文本分类的定义
        2.1.2 文本分类的过程
        2.1.3 文本特征表示方法
        2.1.4 特征选择方法
        2.1.5 文本分类的评估准则
    2.2 特征降维
        2.2.1 线性判别分析法
        2.2.2 主成分分析法
        2.2.3 典型关联分析法
        2.2.4 多标签线性判别分析法
    2.3 多标签分类算法
        2.3.1 多标签k近邻算法
        2.3.2 多标签决策树算法
        2.3.3 二元关联算法
        2.3.4 分类器链算法
        2.3.5 校准标签排序算法
    2.4 本章小结
第3章 一种基于依赖性最大化的特征降维方法
    3.1 引言
    3.2 方法思想及流程
        3.2.1 MDDM方法
        3.2.2 改进的依赖性最大化的特征降维方法
    3.3 实验结果及分析
        3.3.1 实验数据集分析
        3.3.2 结果分析
    3.4 本章小结
第4章 一种基于引力模型的多标签文本分类算法
    4.1 引言
    4.2 算法思想及流程
        4.2.1 质心分类算法
        4.2.2 GM分类模型
        4.2.3 改进的多标签引力分类模型
        4.2.4 算法分析
    4.3 实验结果及分析
        4.3.1 实验数据集分析
        4.3.2 结果分析
    4.4 本章小结
第5章 总结与展望
    5.1 全文总结
    5.2 未来工作展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果


【参考文献】:
期刊论文
[1]面向多标签文本分类的深度主题特征提取[J]. 陈文实,刘心惠,鲁明羽.  模式识别与人工智能. 2019(09)
[2]基于标签相关性的卷积神经网络多标签分类[J]. 余晓龙,林国平.  闽南师范大学学报(自然科学版). 2019(02)
[3]Web文档分类中TFIDF特征选择算法的改进[J]. 段国仑,谢钧,郭蕾蕾,王晓莹.  计算机技术与发展. 2019(05)
[4]基于主题分布优化的模糊文本分类研究[J]. 梁艳红,坎启轩,苏翌.  计算机工程. 2019(10)
[5]文本分类中一种特征选择方法研究[J]. 赵婧,邵雄凯,刘建舟,王春枝.  计算机应用研究. 2019(08)
[6]基于隐马尔科夫模型与语义融合的文本分类[J]. 高知新,徐林会.  计算机应用与软件. 2017(07)
[7]基于机器学习的文本分类技术研究进展[J]. 苏金树,张博锋,徐昕.  软件学报. 2006(09)

硕士论文
[1]基于标签相关特征的多标签降维研究[D]. 李裕.合肥工业大学 2018
[2]中文多标签文本分类算法研究[D]. 周浩.上海交通大学 2014
[3]多标签文本分类算法研究[D]. 吕小勇.山西财经大学 2010



本文编号:3205747

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3205747.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户881af***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com