基于集成学习的数据流分类算法研究
发布时间:2021-04-25 03:53
在社会高速发展、信息急剧增加的大环境中,各个领域的数据呈现爆炸式增长,数据的增量模式使得世界来到了大数据时代。对于如何从海量数据中挖掘有效信息,成为当前社会科学的一个重要关注点。分类技术是机器学习和数据挖掘领域的主要手段之一,主要思想是根据已有的数据以及标签训练分类器来预测未知数据的标签。传统的分类方法用于处理静态数据,所构造的分类模型是固定的,不利于处理动态变化的数据流。数据流具有数量无限,快速到达,及时响应,概念漂移,不平衡等特征。如何应对数据流特征从而进行正确分类,是目前分类问题研究的重点。为了适应数据流随时变化的特点,数据流分类模型也要根据数据的变化做出相应的改变,不断进行调整。数据流中存在概念漂移和不平衡问题,如何有效的检测概念漂移和不平衡,以及处理这两种现象是数据流分类需要处理解决的问题。因此,本文根据不同的数据流处理方法,对数据流分类问题进行了深入的研究,主要内容包括以下两个方面:(1)对数据流进行分块批处理,采用窗口模式,衡量分类模型对前后两个数据块的分类能力。提出了一种基于Kappa系数的概念漂移检测和针对类不平衡的SMOTE采样方法相结合的动态数据流分类算法。该算法...
【文章来源】:山西大学山西省
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文主要工作
1.4 本文组织结构
第二章 数据流相关理论
2.1 数据流概述
2.1.1 数据流的定义与特点
2.1.2 数据流的应用
2.2 数据流中的概念漂移
2.2.1 概念漂移的定义与分类
2.2.2 概念漂移的常用处理方法
2.3 数据流中的类不平衡
2.4 数据流集成学习
2.4.1 集成学习相关理论
2.4.2 数据流集成学习框架
2.5 本章小结
第三章 基于动态数据块的非平衡数据流分类算法
3.1 算法介绍
3.2 实验设置
3.3 结果分析
3.4 本章小结
第四章 基于在线学习的数据流分类算法
4.1 基于在线学习的数据流分类算法
4.1.1 Bagging算法及其改进Online Bagging算法
4.1.2 基于在线学习的数据流分类算法
4.2 实验设置
4.3 结果分析
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
【参考文献】:
期刊论文
[1]The Research of One Novel Cost-Sensitive Classification Algorithm[J]. ZHOU Jingjing,SUN Weifeng,HAN Xiaomin,LU Ruqiang,ZHANG Yuanqi,ZHANG Shenwei. Chinese Journal of Electronics. 2018(05)
[2]基于Kappa系数的数据流分类算法[J]. 徐树良,王俊红. 计算机科学. 2016(12)
[3]由均匀染色导出的强Chernoff界(英文)[J]. 王涛,刘明菊,李德明. 数学杂志. 2014(06)
[4]一种不平衡数据流集成分类模型[J]. 欧阳震诤,罗建书,胡东敏,吴泉源. 电子学报. 2010(01)
本文编号:3158651
【文章来源】:山西大学山西省
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文主要工作
1.4 本文组织结构
第二章 数据流相关理论
2.1 数据流概述
2.1.1 数据流的定义与特点
2.1.2 数据流的应用
2.2 数据流中的概念漂移
2.2.1 概念漂移的定义与分类
2.2.2 概念漂移的常用处理方法
2.3 数据流中的类不平衡
2.4 数据流集成学习
2.4.1 集成学习相关理论
2.4.2 数据流集成学习框架
2.5 本章小结
第三章 基于动态数据块的非平衡数据流分类算法
3.1 算法介绍
3.2 实验设置
3.3 结果分析
3.4 本章小结
第四章 基于在线学习的数据流分类算法
4.1 基于在线学习的数据流分类算法
4.1.1 Bagging算法及其改进Online Bagging算法
4.1.2 基于在线学习的数据流分类算法
4.2 实验设置
4.3 结果分析
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
【参考文献】:
期刊论文
[1]The Research of One Novel Cost-Sensitive Classification Algorithm[J]. ZHOU Jingjing,SUN Weifeng,HAN Xiaomin,LU Ruqiang,ZHANG Yuanqi,ZHANG Shenwei. Chinese Journal of Electronics. 2018(05)
[2]基于Kappa系数的数据流分类算法[J]. 徐树良,王俊红. 计算机科学. 2016(12)
[3]由均匀染色导出的强Chernoff界(英文)[J]. 王涛,刘明菊,李德明. 数学杂志. 2014(06)
[4]一种不平衡数据流集成分类模型[J]. 欧阳震诤,罗建书,胡东敏,吴泉源. 电子学报. 2010(01)
本文编号:3158651
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3158651.html