非平稳环境下数据流集成分类算法研究
发布时间:2021-01-20 07:55
在一些实际应用中随着时间不断产生的数据可以看作是非平稳环境下的数据流,即数据的分布是演变的,数据流中的这一现象又被称为概念漂移。研究中通常采用集成分类算法对数据流进行分类,因为在处理数据过程中所构建的集成分类器自身的模块化结构能够很好的应对数据流中数据分布的变化。在构建集成分类器时通常有两种方式对数据进行处理,一种是使用在线学习方式对数据逐个处理,另一种是将数据划分成相同大小的数据块,以数据块为单位进行处理。基于这两种方式本文分别提出了ROAUE(Recalling Online Accuracy Updated Ensemble)算法和MAUE(Memorizing Based Accuracy Updated Ensemble)算法。ROAUE算法是一种结合过去知识更新所构建的集成分类器的在线集成分类算法,在对数据逐个处理的过程中每隔一个窗口大小会将在最近窗口上的数据训练出来的新分类器加入到集成分类器中,当集成分类器中基分类器的个数达到所设置的上限值时,会选择一个基分类器被新训练出来的分类器替换,在选择基分类器被替换时不仅考虑每个基分类器当前时刻的权重值,还通过存储有限个过去时刻的...
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
数据流分类算法处理数据循环图
在线处理方式
基于数据块处理方式
【参考文献】:
期刊论文
[1]一种基于深度属性加权的数据流自适应集成分类算法[J]. 李尧,王志海,孙艳歌,张伟. 山东大学学报(工学版). 2018(06)
[2]类别严重不均衡应用的在线数据流学习算法[J]. 赵强利,蒋艳凰. 计算机科学. 2017(06)
[3]概念漂移数据流挖掘算法综述[J]. 丁剑,韩萌,李娟. 计算机科学. 2016(12)
[4]基于信息熵的自适应网络流概念漂移分类方法[J]. 潘吴斌,程光,郭晓军,黄顺翔. 计算机学报. 2017(07)
[5]具有回忆和遗忘机制的数据流挖掘模型与算法[J]. 赵强利,蒋艳凰,卢宇彤. 软件学报. 2015(10)
[6]概念漂移数据流分类研究综述[J]. 文益民,强保华,范志刚. 智能系统学报. 2013(02)
本文编号:2988681
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
数据流分类算法处理数据循环图
在线处理方式
基于数据块处理方式
【参考文献】:
期刊论文
[1]一种基于深度属性加权的数据流自适应集成分类算法[J]. 李尧,王志海,孙艳歌,张伟. 山东大学学报(工学版). 2018(06)
[2]类别严重不均衡应用的在线数据流学习算法[J]. 赵强利,蒋艳凰. 计算机科学. 2017(06)
[3]概念漂移数据流挖掘算法综述[J]. 丁剑,韩萌,李娟. 计算机科学. 2016(12)
[4]基于信息熵的自适应网络流概念漂移分类方法[J]. 潘吴斌,程光,郭晓军,黄顺翔. 计算机学报. 2017(07)
[5]具有回忆和遗忘机制的数据流挖掘模型与算法[J]. 赵强利,蒋艳凰,卢宇彤. 软件学报. 2015(10)
[6]概念漂移数据流分类研究综述[J]. 文益民,强保华,范志刚. 智能系统学报. 2013(02)
本文编号:2988681
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2988681.html