基于Kappa系数的数据流分类算法
发布时间:2017-06-17 13:12
本文关键词:基于Kappa系数的数据流分类算法,,由笔耕文化传播整理发布。
【摘要】:数据流挖掘已经成为数据挖掘领域一个热门的研究方向,由于数据流中概念漂移现象的存在,使得传统的分类算法无法直接应用于数据流中。为了能有效地应对数据流中的概念漂移,提出了一种基于Kappa系数的数据流分类算法。该算法采用集成式分类技术,以Kappa系数度量系统的分类性能,根据Kappa系数来动态地调整分类器,当发生概念漂移时,系统能利用已有的知识很快删除不符合要求的分类器来适应新概念。实验结果表明,相对于实验中参与比较的BWE,AE和AWE算法,该算法不但具有较好的分类性能,而且在一定程度上能较为有效地降低时间开销。
【作者单位】: 山西大学计算机与信息技术学院;计算智能与中文信息处理教育部重点实验室;
【关键词】: 数据流 概念漂移 分类 Kappa系数
【基金】:国家自然科学基金(61202018)资助
【分类号】:TP311.13
【正文快照】: 到稿日期:2015-10-21返修日期:2016-03-25本文受国家自然科学基金(61202018)资助。1引言随着信息社会的发展,如电话通信、电子商务、股票交易、舆情监测、网络流量监控等许多领域产生了大量的数据流,这些数据与传统的静态数据有着较大区别,往往具有数量无限、连续到达和概念漂
本文关键词:基于Kappa系数的数据流分类算法,由笔耕文化传播整理发布。
本文编号:458446
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/458446.html