基于可能性理论的多标签分类研究
发布时间:2021-11-11 08:52
随着计算机和网络技术的飞速发展,在文字、图片、音频等不同领域上的多标签数据集越来越多.能否实现海量多标签数据的有效挖掘和运用是当下人们所面临的重要挑战之一.数据分类技术作为一项重要的数据挖掘工具,其目的是从大量数据中提取有价值的信息并对未知标签的样本进行归类.目前较为成熟的分类算法大多是用于处理完整的数据,然而在一些实际应用中,由于专家知识的不足、仪器测量中的误差等,不精确的数据普遍存在.近年来,可能性理论常被用于处理不确定性信息.本文针对不精确数据,展开了基于可能性理论的多标签分类算法的研究.首先,本文提出了一种加权朴素可能分类算法,通过度量各属性变量的重要性程度以及各属性中不同取值在分类中的贡献程度,对已有的朴素可能分类器进行改进.类似于信息增益在概率理论中的作用,非特异性增益则是可能性理论中用于衡量不确定信息的依据,因而本文的度量方法选用非特异性增益.利用MATLAB软件在UCI中的八个数据集以及人工生成的不精确数据集上进行仿真实验,结果验证了我们提出的加权朴素可能分类算法在大部分数据集上有着较好的分类性能.其次,本文借助可能性理论,结合单标签分类中的可能分类器,对多标签分类问题...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 课题背景与意义
1.1.1 数据挖掘背景与意义
1.1.2 不确定性背景与意义
1.2 数据分类的研究现状
1.2.1 数据挖掘的功能
1.2.2 单标签分类的研究现状
1.2.3 多标签分类的研究现状
1.3 可能性理论分类问题
1.4 本文的主要内容和结构安排
第二章 可能性理论相关知识
2.1 可能性理论
2.1.1 可能性分布
2.1.2 条件可能性分布
2.1.3 可能性测度
2.1.4 可能性理论中的不确定度
2.2 朴素可能分类器
2.2.1 可能分类器原理
2.2.2 条件可能性分布
2.3 本章小结
第三章 基于特征加权的朴素可能分类器
3.1 特征加权方法
3.2 加权朴素可能分类算法
3.2.1 基于属性贡献度的特征加权
3.2.2 基于非特异性增益的特征加权
3.2.3 具体的算法流程
3.2.4 算法复杂度
3.3 实验部分
3.3.1 数据集
3.3.2 实验设置
3.3.3 实验结果分析
3.4 本章小结
第四章 基于可能性理论的多标签分类问题
4.1 多标签分类问题
4.1.1 常用的方法
4.2 基于可能性的多标签分类
4.2.1 朴素可能二元相关分类器
4.2.2 树朴素可能链分类器
4.3 实验仿真
4.3.1 数据集
4.3.2 评估标准
4.3.3 实验结果与分析
4.4 本章小结
第五章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
致谢
作者简介
【参考文献】:
博士论文
[1]不确定性信息处理的随机集方法及在系统可靠性评估与故障诊断中的应用[D]. 徐晓滨.上海海事大学 2009
本文编号:3488567
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 课题背景与意义
1.1.1 数据挖掘背景与意义
1.1.2 不确定性背景与意义
1.2 数据分类的研究现状
1.2.1 数据挖掘的功能
1.2.2 单标签分类的研究现状
1.2.3 多标签分类的研究现状
1.3 可能性理论分类问题
1.4 本文的主要内容和结构安排
第二章 可能性理论相关知识
2.1 可能性理论
2.1.1 可能性分布
2.1.2 条件可能性分布
2.1.3 可能性测度
2.1.4 可能性理论中的不确定度
2.2 朴素可能分类器
2.2.1 可能分类器原理
2.2.2 条件可能性分布
2.3 本章小结
第三章 基于特征加权的朴素可能分类器
3.1 特征加权方法
3.2 加权朴素可能分类算法
3.2.1 基于属性贡献度的特征加权
3.2.2 基于非特异性增益的特征加权
3.2.3 具体的算法流程
3.2.4 算法复杂度
3.3 实验部分
3.3.1 数据集
3.3.2 实验设置
3.3.3 实验结果分析
3.4 本章小结
第四章 基于可能性理论的多标签分类问题
4.1 多标签分类问题
4.1.1 常用的方法
4.2 基于可能性的多标签分类
4.2.1 朴素可能二元相关分类器
4.2.2 树朴素可能链分类器
4.3 实验仿真
4.3.1 数据集
4.3.2 评估标准
4.3.3 实验结果与分析
4.4 本章小结
第五章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
致谢
作者简介
【参考文献】:
博士论文
[1]不确定性信息处理的随机集方法及在系统可靠性评估与故障诊断中的应用[D]. 徐晓滨.上海海事大学 2009
本文编号:3488567
本文链接:https://www.wllwen.com/kejilunwen/yysx/3488567.html