多标签特征选择及分类器链算法的研究
发布时间:2021-01-12 17:32
近年来,随着机器学习领域的迅速发展,分类问题作为机器学习领域一个重要问题得到广泛研究和应用。分类问题通常指单标签分类,即将未知实例划分到单一类别中,然而现实世界中的许多应用场景是多标签的,即实例同时归于多个类别之中。多标签分类最早应用于文本分类中,现在已在图像标注、音乐情感分类、生物信息学、信息检索等多个场景得到研究和应用。多标签特征选择算法和分类算法是多标签研究领域的两个重要部分,由于多标签的特性使得特征选择算法相较单标签特征选择更为复杂,而现在已有的多标签分类算法仍有很大的改进空间。本文对多标签特征选择算法和多标签分类算法两方面进行研究,主要工作如下:(1)提出了基于遗传算法和最大相关最小冗余的多标签特征选择算法(MLFS-GM)。MLFS-GM算法基于遗传算法和最大相关最小冗余策略:考虑标签之间的相关性,特征之间的冗余性以及特征与标签之间的相关性,用信息论中的互信息建模相关性和冗余性,从而给出遗传算法的特征集适应度函数。在多个多标签公开数据集上的实验表明,本文算法在绝大多数评价指标上优于同样基于遗传算法的GA-ML-CFS算法和采用信息增益建模标签与特征相关性的MLFSIE 算法...
【文章来源】:山东科技大学山东省
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 研究内容及主要工作
1.4 论文的组织结构
2 相关概念及理论
2.1 多标签特征选择简介
2.2 多标签分类算法简介
2.3 遗传算法简介
2.4 谱聚类简介
2.5 本章小结
3 基于遗传算法和最大相关最小冗余的多标签特征选择算法
3.1 算法详述
3.2 特征选择实验结果及分析
3.3 本章小结
4 基于标签集划分和贪心策略的多标签分类器链算法
4.1 标签子集选择划分
4.2 分类器链序的确定
4.3 算法描述和复杂度分析
4.4 分类算法实验结果及分析
4.5 本章小结
5 总结和展望
5.1 总结
5.2 展望
参考文献
致谢
攻读硕士学位期间主要研究成果
【参考文献】:
期刊论文
[1]扩展ReliefF的两种多标签特征选择算法[J]. 马晶莹,宣恒农. 计算机应用与软件. 2017(07)
[2]一类基于信息熵的多标签特征选择算法[J]. 张振海,李士宁,李志刚,陈昊. 计算机研究与发展. 2013(06)
[3]一种基于信息增益及遗传算法的特征选择算法[J]. 任江涛,孙婧昊,黄焕宇,印鉴. 计算机科学. 2006(10)
博士论文
[1]基于改进遗传算法的汽车装配生产线平衡问题研究[D]. 李险峰.北京科技大学 2017
本文编号:2973227
【文章来源】:山东科技大学山东省
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 研究内容及主要工作
1.4 论文的组织结构
2 相关概念及理论
2.1 多标签特征选择简介
2.2 多标签分类算法简介
2.3 遗传算法简介
2.4 谱聚类简介
2.5 本章小结
3 基于遗传算法和最大相关最小冗余的多标签特征选择算法
3.1 算法详述
3.2 特征选择实验结果及分析
3.3 本章小结
4 基于标签集划分和贪心策略的多标签分类器链算法
4.1 标签子集选择划分
4.2 分类器链序的确定
4.3 算法描述和复杂度分析
4.4 分类算法实验结果及分析
4.5 本章小结
5 总结和展望
5.1 总结
5.2 展望
参考文献
致谢
攻读硕士学位期间主要研究成果
【参考文献】:
期刊论文
[1]扩展ReliefF的两种多标签特征选择算法[J]. 马晶莹,宣恒农. 计算机应用与软件. 2017(07)
[2]一类基于信息熵的多标签特征选择算法[J]. 张振海,李士宁,李志刚,陈昊. 计算机研究与发展. 2013(06)
[3]一种基于信息增益及遗传算法的特征选择算法[J]. 任江涛,孙婧昊,黄焕宇,印鉴. 计算机科学. 2006(10)
博士论文
[1]基于改进遗传算法的汽车装配生产线平衡问题研究[D]. 李险峰.北京科技大学 2017
本文编号:2973227
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2973227.html