不平衡时间序列集成分类方法研究
发布时间:2023-12-11 17:59
时间序列分类和不平衡数据分布是实际应用中普遍存在的问题。时间序列存在数据维度高、数据之间相关性强和噪声干扰多等特点,而不平衡数据学习则更加强调分类器对少数类样本的识别能力。这两个问题在实际应用中容易产生交集,成为更具有挑战性的不均衡时间序列分类(Imbalanced Time Series Classification,ITSC)问题。现有的针对ITSC问题的解决方法以重采样方法的优化为主,但是由于时间序列数据结构上的复杂性使采样过程变得更加困难。在时间序列分类方面,2018年提出的通用集成学习算法HIVE-COTE在公共时间序列数据集上取得了最好的分类效果,但是该算法处理的对象是类分布平衡的时间序列数据集,在面对不平衡时间序列分类和大规模时间序列分类问题时,该算法的分类效果并不令人满意。在这一背景下,本文从以下三个方面展开研究工作。一、不平衡时序数据子序列质量评价指标的改进针对不平衡时间序列中子序列选择影响分类质量的问题,分析信息增益值在不平衡数据集上的不适用性,并分别结合在不平衡数据集上应用较为广泛的AUC值和AUCPR值两个评价指标,对子序列质量的评价指标进行了改进。同时,选取时...
【文章页数】:84 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
变量注释表
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 论文结构
1.5 本章小结
2 相关工作
2.1 不平衡数据分类质量评价指标概述
2.2 不平衡分类方法概述
2.3 集成学习理论概述
2.4 分布式计算平台简介
2.5 本章小结
3 不平衡时序数据子序列质量评价指标的改进
3.1 引言
3.2 相关符号与定义
3.3 信息增益值对不平衡时序的不适用性分析
3.4 针对子序列质量评价指标的改进
3.5 实验结果与分析
3.6 本章小结
4 不平衡时间序列集成分类算法研究
4.1 引言
4.2 相关算法介绍
4.3 结合BOOSTING和 SMOM采样的ST..HESCA组件算法
4.4 IMHIVE-COTE集成分类算法
4.5 实验结果与分析
4.6 本章小结
5 不平衡时间序列并行集成分类算法研究
5.1 引言
5.2 IMHIVE-COTE算法的并行化流程设计
5.3 IMHIVE-COTE组件算法的并行化实现
5.4 实验结果与分析
5.5 本章小结
6 总结和展望
6.1 总结
6.2 展望
参考文献
作者简历
学位论文数据集
本文编号:3873043
【文章页数】:84 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
变量注释表
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 论文结构
1.5 本章小结
2 相关工作
2.1 不平衡数据分类质量评价指标概述
2.2 不平衡分类方法概述
2.3 集成学习理论概述
2.4 分布式计算平台简介
2.5 本章小结
3 不平衡时序数据子序列质量评价指标的改进
3.1 引言
3.2 相关符号与定义
3.3 信息增益值对不平衡时序的不适用性分析
3.4 针对子序列质量评价指标的改进
3.5 实验结果与分析
3.6 本章小结
4 不平衡时间序列集成分类算法研究
4.1 引言
4.2 相关算法介绍
4.3 结合BOOSTING和 SMOM采样的ST..HESCA组件算法
4.4 IMHIVE-COTE集成分类算法
4.5 实验结果与分析
4.6 本章小结
5 不平衡时间序列并行集成分类算法研究
5.1 引言
5.2 IMHIVE-COTE算法的并行化流程设计
5.3 IMHIVE-COTE组件算法的并行化实现
5.4 实验结果与分析
5.5 本章小结
6 总结和展望
6.1 总结
6.2 展望
参考文献
作者简历
学位论文数据集
本文编号:3873043
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3873043.html