分布式数据流决策树VFDT分类算法研究
发布时间:2017-11-01 15:36
本文关键词:分布式数据流决策树VFDT分类算法研究
更多相关文章: 数据流 数据挖掘 决策树 Storm SAMOA
【摘要】:随着大数据时代的到来,网络上充斥着大量高速变化的数据流,然而传统数据挖掘技术不能很好地直接应用到数据流上。研究基于决策树的数据流分类挖掘算法,其研究思路是首先描述一般决策树;然后重点阐述数据流决策树VFDT的算法的实现,采用Twitter Storm分布式流式计算框架的并行计算和Yahoo SAMOA机器学习平台,对VFDT算法进行并行化设计;最后通过实验验证并行化的VHT决策树算法具有良好的运行效率与性能。
【作者单位】: 华南师范大学物理与电信工程学院;华南理工大学经济与贸易学院;
【关键词】: 数据流 数据挖掘 决策树 Storm SAMOA
【基金】:广东省公益研究与能力建设专项资金项目(No.2016A020223012,No.2015A020217011) 广东省交通科技计划项目(No.2015-02-064) 广东外语外贸大学南国商学院2016年教改重大项目 广州大学华软软件学院重大科研培育项目(20000104与教研项目KY201412)
【分类号】:TP311.13
【正文快照】: 1数据流及其典型处理平台概述随着互联网应用的发展,产生大量的流数据(下文采用通用的说法“数据流”),与传统的静止数据不同。数据流是海量的、高速的、实时的。其蕴涵着大量信息,可以用来作为智能决策的依据。预测和分类是基本数据分析两种形式[1],可以用于提取描述重要数据,
本文编号:1127483
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1127483.html