当前位置:主页 > 科技论文 > 软件论文 >

基于密度的不确定数据流聚类算法

发布时间:2019-05-31 20:25
【摘要】:不确定性的出现使传统算法无法直接用于聚类不确定数据流。该文提出一种不确定数据流环境下基于密度的聚类算法,其中提出不确定度的概念以衡量不确定数据的分布信息,并在改进面向确定数据的聚类算法DENCLUE的基础上,提出一种可处理数据不确定度的UDENCLUE算法,以降低数据的不确定性对聚类结果产生的影响;提出滑动窗口下基于密度的不确定数据流聚类算法USDENCLUE,通过聚类特征指数直方图技术实现快速剪枝,可以高效处理噪音数据、演化数据流并生成任意形状的簇;采用真实数据集及人工合成数据集对USDENCLUE与CluStream聚类算法进行比较,实验结果表明了所提出算法的高效性和有效性。
[Abstract]:With the emergence of uncertainty, the traditional algorithm can not be directly used to cluster uncertain data streams. In this paper, a density-based clustering algorithm in uncertain data flow environment is proposed, in which the concept of uncertainty is proposed to measure the distribution information of uncertain data, and on the basis of improving the clustering algorithm DENCLUE for deterministic data, In order to reduce the influence of data uncertainty on clustering results, a UDENCLUE algorithm is proposed, which can deal with the uncertainty of data. A density-based uncertain data stream clustering algorithm USDENCLUE, based on sliding window is proposed to realize fast pruning by clustering feature index histogram technique, which can process noise data efficiently, evolve data stream and generate clusters of arbitrary shape. The real data set and the synthetic data set are used to compare the USDENCLUE clustering algorithm with the CluStream clustering algorithm. The experimental results show that the proposed algorithm is efficient and effective.
【作者单位】: 东北大学计算机科学与工程学院;
【基金】:国家自然科学基金面上项目(61173029,61672144)
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 申德荣;于戈;寇月;聂铁铮;;可能世界内数值型不确定数据匹配模型[J];计算机应用研究;2008年09期

2 崔斌;卢阳;;基于不确定数据的查询处理综述[J];计算机应用;2008年11期

3 徐雪松;;时间序列不确定数据流中异常数据检测方法[J];电子设计工程;2011年19期

4 徐雪松;李玲娟;郭立玮;;基于优化策略的不确定数据流预测方法[J];计算机工程;2011年21期

5 徐雪松;沈红红;陶帆;胡晓璐;崔伟;;基于小波分析的不确定数据流异常数据检测[J];软件导刊;2011年11期

6 钱江波;王志杰;陈华辉;王海斌;;不确定数据流自适应并行连接算法及应用[J];电信科学;2012年02期

7 向剑平;乔少杰;胡剑;;基于不确定数据理论的道路相关度度量方法[J];计算机工程与设计;2012年06期

8 蒋涛;高云君;张彬;周傲英;乐光学;;不确定数据查询处理[J];电子学报;2013年05期

9 王爽;杨广明;朱志良;;基于不确定数据的频繁项查询算法[J];东北大学学报(自然科学版);2011年03期

10 王意洁;李小勇;祁亚斐;孙伟东;;不确定数据查询技术研究[J];计算机研究与发展;2012年07期

相关会议论文 前6条

1 高聪;申德荣;于戈;聂铁铮;寇月;;一种基于不确定数据的挖掘频繁集方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

2 周逊;李建中;石胜飞;;不确定数据上聚集查询的分布式处理算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

3 王晓伟;黄九鸣;贾焰;;分布式不确定数据上的概率Skyline计算[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

4 艾文凯;张剡;柏文阳;;基于用户偏好的不确定数据阈值轮廓查询算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

5 陆叶;王丽珍;张晓峰;;从不确定数据集中挖掘频繁Co-location模式[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

6 孙永佼;王国仁;;P2P环境中不确定数据Top-k查询处理算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

相关博士学位论文 前10条

1 陈静玉;面向不确定数据流的聚类和模式挖掘技术研究[D];西安电子科技大学;2014年

2 曹科研;不确定数据的聚类分析与异常点检测算法[D];东北大学;2014年

3 李佳佳;不确定数据的概率近邻查询处理技术研究[D];东北大学;2014年

4 徐传飞;面向多维不确定数据的若干查询处理关键技术的研究[D];东北大学;2013年

5 罗昌银;位置及文本相关查询处理及验证策略研究[D];华中科技大学;2015年

6 汤克明;不确定数据流中频繁数据挖掘研究[D];南京航空航天大学;2012年

7 梁春泉;不确定数据流分类算法研究[D];西北农林科技大学;2014年

8 高明;不确定数据的世系管理和相似性查询[D];复旦大学;2011年

9 董俊;不确定数据中数据挖掘方法的研究[D];燕山大学;2012年

10 孙永佼;P2P环境下排序查询处理和分类技术的研究[D];东北大学;2012年

相关硕士学位论文 前10条

1 孙凤姣;概率XML数据文档的分发技术研究[D];大连海事大学;2015年

2 李雨明;不确定数据的挖掘算法研究[D];上海交通大学;2015年

3 曹庆傲;不确定性数据Top-k查询算法与实现[D];贵州大学;2015年

4 李红;不确定数据流查询处理算法的研究[D];黑龙江大学;2015年

5 甘果;基于不确定数据的范围查询算法的研究与实现[D];东北大学;2014年

6 张昕;基于分布式极限学习机的不确定数据流分类技术的研究与实现[D];东北大学;2014年

7 郎泓钰;面向不确定数据的最近邻分类方法研究[D];辽宁师范大学;2015年

8 赵超群;不确定数据质量评估系统的设计与实现[D];东北大学;2014年

9 梁s,

本文编号:2489994


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2489994.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1b181***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com