基于密度的不确定数据流聚类算法
[Abstract]:With the emergence of uncertainty, the traditional algorithm can not be directly used to cluster uncertain data streams. In this paper, a density-based clustering algorithm in uncertain data flow environment is proposed, in which the concept of uncertainty is proposed to measure the distribution information of uncertain data, and on the basis of improving the clustering algorithm DENCLUE for deterministic data, In order to reduce the influence of data uncertainty on clustering results, a UDENCLUE algorithm is proposed, which can deal with the uncertainty of data. A density-based uncertain data stream clustering algorithm USDENCLUE, based on sliding window is proposed to realize fast pruning by clustering feature index histogram technique, which can process noise data efficiently, evolve data stream and generate clusters of arbitrary shape. The real data set and the synthetic data set are used to compare the USDENCLUE clustering algorithm with the CluStream clustering algorithm. The experimental results show that the proposed algorithm is efficient and effective.
【作者单位】: 东北大学计算机科学与工程学院;
【基金】:国家自然科学基金面上项目(61173029,61672144)
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 申德荣;于戈;寇月;聂铁铮;;可能世界内数值型不确定数据匹配模型[J];计算机应用研究;2008年09期
2 崔斌;卢阳;;基于不确定数据的查询处理综述[J];计算机应用;2008年11期
3 徐雪松;;时间序列不确定数据流中异常数据检测方法[J];电子设计工程;2011年19期
4 徐雪松;李玲娟;郭立玮;;基于优化策略的不确定数据流预测方法[J];计算机工程;2011年21期
5 徐雪松;沈红红;陶帆;胡晓璐;崔伟;;基于小波分析的不确定数据流异常数据检测[J];软件导刊;2011年11期
6 钱江波;王志杰;陈华辉;王海斌;;不确定数据流自适应并行连接算法及应用[J];电信科学;2012年02期
7 向剑平;乔少杰;胡剑;;基于不确定数据理论的道路相关度度量方法[J];计算机工程与设计;2012年06期
8 蒋涛;高云君;张彬;周傲英;乐光学;;不确定数据查询处理[J];电子学报;2013年05期
9 王爽;杨广明;朱志良;;基于不确定数据的频繁项查询算法[J];东北大学学报(自然科学版);2011年03期
10 王意洁;李小勇;祁亚斐;孙伟东;;不确定数据查询技术研究[J];计算机研究与发展;2012年07期
相关会议论文 前6条
1 高聪;申德荣;于戈;聂铁铮;寇月;;一种基于不确定数据的挖掘频繁集方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 周逊;李建中;石胜飞;;不确定数据上聚集查询的分布式处理算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
3 王晓伟;黄九鸣;贾焰;;分布式不确定数据上的概率Skyline计算[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
4 艾文凯;张剡;柏文阳;;基于用户偏好的不确定数据阈值轮廓查询算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
5 陆叶;王丽珍;张晓峰;;从不确定数据集中挖掘频繁Co-location模式[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
6 孙永佼;王国仁;;P2P环境中不确定数据Top-k查询处理算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
相关博士学位论文 前10条
1 陈静玉;面向不确定数据流的聚类和模式挖掘技术研究[D];西安电子科技大学;2014年
2 曹科研;不确定数据的聚类分析与异常点检测算法[D];东北大学;2014年
3 李佳佳;不确定数据的概率近邻查询处理技术研究[D];东北大学;2014年
4 徐传飞;面向多维不确定数据的若干查询处理关键技术的研究[D];东北大学;2013年
5 罗昌银;位置及文本相关查询处理及验证策略研究[D];华中科技大学;2015年
6 汤克明;不确定数据流中频繁数据挖掘研究[D];南京航空航天大学;2012年
7 梁春泉;不确定数据流分类算法研究[D];西北农林科技大学;2014年
8 高明;不确定数据的世系管理和相似性查询[D];复旦大学;2011年
9 董俊;不确定数据中数据挖掘方法的研究[D];燕山大学;2012年
10 孙永佼;P2P环境下排序查询处理和分类技术的研究[D];东北大学;2012年
相关硕士学位论文 前10条
1 孙凤姣;概率XML数据文档的分发技术研究[D];大连海事大学;2015年
2 李雨明;不确定数据的挖掘算法研究[D];上海交通大学;2015年
3 曹庆傲;不确定性数据Top-k查询算法与实现[D];贵州大学;2015年
4 李红;不确定数据流查询处理算法的研究[D];黑龙江大学;2015年
5 甘果;基于不确定数据的范围查询算法的研究与实现[D];东北大学;2014年
6 张昕;基于分布式极限学习机的不确定数据流分类技术的研究与实现[D];东北大学;2014年
7 郎泓钰;面向不确定数据的最近邻分类方法研究[D];辽宁师范大学;2015年
8 赵超群;不确定数据质量评估系统的设计与实现[D];东北大学;2014年
9 梁s,
本文编号:2489994
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2489994.html