基于属性维划分和MapReduce的道路运输信息系统数据聚类
发布时间:2018-01-12 07:12
本文关键词:基于属性维划分和MapReduce的道路运输信息系统数据聚类 出处:《华南理工大学学报(自然科学版)》2014年08期 论文类型:期刊论文
更多相关文章: 道路运输 DBSCAN 属性维 划分 MapReduce 聚类
【摘要】:针对基于密度的带有噪声空间聚类分析(DBSCAN)的不足,融合了领域知识和划分思想,提出了属性维划分的概念,并论证了基于局部簇合并与核心点计算的剪枝原理,最后结合云计算编程模式MapReduce的特点,给出了DBSCAN的优化方法,并在实际道路运输信息系统数据的聚类分析中得到应用验证.实践证明划分后的数据集易于实现并行聚类数据挖掘,文中优化方法优于一般的统计分析方法.
[Abstract]:Aiming at the shortage of density - based cluster cluster analysis ( DBSCAN ) , the concept of attribute dimension classification is put forward , and the principle of pruning based on the combination of local cluster and core point is put forward . Finally , based on the characteristics of MapReduce in cloud computing programming mode , the optimization method of DBSCAN is presented , and the application verification is obtained in the cluster analysis of the data of the actual road transport information system . It has been proved that the data set after division is easy to implement parallel clustering data mining , and the optimization method is superior to the general statistical analysis method .
【作者单位】: 华南理工大学土木与交通学院;
【基金】:国家自然科学基金资助项目(61174184) 广东省工业科技攻关计划项目(2008B010200010) 广州市科技支撑项目(2011J4300045)
【分类号】:U495
【正文快照】: 聚类是数据挖掘与统计分析的一个重要的研究领域,近年来得到广泛的研究和应用[1-2].聚类分析可实现无监督的机器学习,在对数据集的分布没有任何了解的前提下,将数据对象分组成为多个类或簇(Cluster),使一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大,从而找到
【参考文献】
相关期刊论文 前1条
1 谢永红;马延辉;周芳;刘颖安;;PDBSCAN: Parallel DBSCAN for Large-Scale Clustering Applications[J];Journal of Donghua University(English Edition);2012年01期
相关博士学位论文 前1条
1 唐亮;信息化条件下营运车辆安全监管关键技术研究[D];重庆大学;2012年
【共引文献】
相关期刊论文 前10条
1 蔡颖琨,谢昆青,马修军;屏蔽了输入参数敏感性的DBSCAN改进算法[J];北京大学学报(自然科学版);2004年03期
2 谷波,张永奎;文本聚类算法的分析与比较[J];电脑开发与应用;2003年11期
3 王红;许t,
本文编号:1413207
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/1413207.html