弱标记数据不确定性度量及特征选择研究
发布时间:2021-04-15 21:09
处理多标记数据是机器学习和数据挖掘当中一个非常重要的任务,它已经引起了诸多学者的广泛研究。然而,在实际应用领域中,例如图像识别、文本分类等场景下,想要获得数据的完整标记来进行学习和训练通常是一件非常困难并且代价十分昂贵的事情。我们获得的往往是部分标记的数据或者带有缺失标记的多标记数据,即弱标记数据。到目前为止,关于弱标记数据中不确定性度量问题的研究并不多。实际上,不确定性度量有助于我们发现蕴含在弱标记数据当中的潜在特征和更加实质性的内容。信息熵早已被用于评估和描述数据的不确定性,但是,它们往往针对的是单标记数据,并不适用于多标记数据,尤其是弱标记数据。因此,本文提出一种新形式的类似条件熵的度量来描述弱标记数据的不确定性,以期进一步挖掘弱标记数据的价值,助力弱标记数据的特征选择等任务及应用。本文紧密围绕弱标记数据的不确定性度量和特征选择展开研究,主要研究工作及贡献如下:(1)本文提出了一种单调相容条件熵的形式来描述和度量弱标记数据的不确定性。这一新形式的不确定性度量主要是借助模糊粗糙集当中的相似类及相容类的概念分别处理特征空间和不完备的标记空间,结合条件熵完成新的定义使其更加适应弱标记数...
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 多标记学习与特征选择
1.2.2 粗糙集与不确定性度量
1.3 研究内容与论文结构
1.3.1 研究内容
1.3.2 论文结构
第2章 相关工作概述及基础知识
2.1 相关工作
2.1.1 扩充的Pawlak近似精度度量
2.1.2 不完备决策系统中的不确定性度量
2.1.3 基于信息理论的多标记数据特征选择
2.2 基础知识
2.2.1 单标记决策表和弱标记系统
2.2.2 模糊相似关系和相容关系
2.2.3 信息熵理论
2.3 本章小结
第3章 弱标记数据的不确定性度量
3.1 引言
3.2 单调的相容条件熵
3.3 性质及理论证明
3.4 实验与分析
3.4.1 数据描述
3.4.2 结果与分析
3.5 本章小结
第4章 弱标记数据的特征选择算法
4.1 引言
4.2 约简和特征选择算法
4.3 实验及分析
4.3.1 数据描述
4.3.2 评价指标
4.3.3 对比算法
4.3.4 结果与分析
4.4 本章小结
第5章 结语
5.1 总结
5.2 展望
参考文献
发表论文和参加科研情况说明
致谢
【参考文献】:
期刊论文
[1]基于边界域和知识粒度的粗糙集不确定性度量[J]. 黄国顺,文翰. 控制与决策. 2016(06)
[2]基于决策粗糙集的多标记情绪分类[J]. 张志飞,苗夺谦,张红云. 模式识别与人工智能. 2015(08)
本文编号:3140087
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 多标记学习与特征选择
1.2.2 粗糙集与不确定性度量
1.3 研究内容与论文结构
1.3.1 研究内容
1.3.2 论文结构
第2章 相关工作概述及基础知识
2.1 相关工作
2.1.1 扩充的Pawlak近似精度度量
2.1.2 不完备决策系统中的不确定性度量
2.1.3 基于信息理论的多标记数据特征选择
2.2 基础知识
2.2.1 单标记决策表和弱标记系统
2.2.2 模糊相似关系和相容关系
2.2.3 信息熵理论
2.3 本章小结
第3章 弱标记数据的不确定性度量
3.1 引言
3.2 单调的相容条件熵
3.3 性质及理论证明
3.4 实验与分析
3.4.1 数据描述
3.4.2 结果与分析
3.5 本章小结
第4章 弱标记数据的特征选择算法
4.1 引言
4.2 约简和特征选择算法
4.3 实验及分析
4.3.1 数据描述
4.3.2 评价指标
4.3.3 对比算法
4.3.4 结果与分析
4.4 本章小结
第5章 结语
5.1 总结
5.2 展望
参考文献
发表论文和参加科研情况说明
致谢
【参考文献】:
期刊论文
[1]基于边界域和知识粒度的粗糙集不确定性度量[J]. 黄国顺,文翰. 控制与决策. 2016(06)
[2]基于决策粗糙集的多标记情绪分类[J]. 张志飞,苗夺谦,张红云. 模式识别与人工智能. 2015(08)
本文编号:3140087
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3140087.html