基于实例与逻辑回归的多标签分类模型
发布时间:2021-08-17 19:10
进入大数据时代,如何有效利用这些数据成为迫切需要解决的问题,分类是最常见的任务之一。其中一种比较特殊的情况是一个样本具有多个标签的分类问题,即多标签分类问题。随着相关研究的不断深入,多标签分类的重要程度及其应用价值已逐步显现出来。目前,人们通过与各种学习技术相结合,提出了很多不同类型的多标签分类模型。尽管如此,标签之间的相关性、模型的优化问题认识仍然不够深入。本文针对该问题设计了一种基于实例和逻辑回归的多标签分类模型。基于实例的学习是从邻居的角度出发,从距离它最近的K个邻居处获得参考信息。然后将从邻居处获得信息与其它额外特征相结合,构造逻辑回归模型,也就是将基于实例的学习方法与逻辑回归方法相结合。这一模型在基于实例的学习过程中考虑了局部最优性,在构造逻辑回归模型过程中考虑了全局最优性和标签之间的相关性,有效地提高了模型的性能。在实验部分,本文首先总结了一些被广泛采用多标签分类算法的评价标准,然后基于电子商务应用进行实验,最后就结果与现有的一些多标签分类模型进行了比较。
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:30 页
【学位级别】:硕士
【部分图文】:
随机游走图
【参考文献】:
期刊论文
[1]利用最近邻信息快速分类多标签数据[J]. 乔健,田庆. 计算机工程与应用. 2011(32)
[2]一种基于随机游走模型的多标签分类算法[J]. 郑伟,王朝坤,刘璋,王建民. 计算机学报. 2010(08)
[3]多标签分类器准确性评估方法的研究[J]. 秦锋,黄俊,程泽凯,杨帆. 计算机技术与发展. 2010(01)
[4]基于机器学习的文本分类技术研究进展[J]. 苏金树,张博锋,徐昕. 软件学报. 2006(09)
本文编号:3348329
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:30 页
【学位级别】:硕士
【部分图文】:
随机游走图
【参考文献】:
期刊论文
[1]利用最近邻信息快速分类多标签数据[J]. 乔健,田庆. 计算机工程与应用. 2011(32)
[2]一种基于随机游走模型的多标签分类算法[J]. 郑伟,王朝坤,刘璋,王建民. 计算机学报. 2010(08)
[3]多标签分类器准确性评估方法的研究[J]. 秦锋,黄俊,程泽凯,杨帆. 计算机技术与发展. 2010(01)
[4]基于机器学习的文本分类技术研究进展[J]. 苏金树,张博锋,徐昕. 软件学报. 2006(09)
本文编号:3348329
本文链接:https://www.wllwen.com/shekelunwen/ljx/3348329.html