基于K-means的数据流离群点检测算法
本文选题:概念漂移 切入点:数据流 出处:《计算机工程与应用》2017年03期 论文类型:期刊论文
【摘要】:针对数据流中离群点挖掘问题,在K-means聚类算法基础上,提出了基于距离的准则进行数据间离群点判断的离群点检测DOKM算法。根据数据流概念漂移检测结果来自适应地调整滑动窗口大小,从而实现对数据流的离群点检测,与其他离群点算法的一系列实验验证和对比结果表明,DOKM算法在人工数据集和真实数据集中均可以实现对离群点的有效检测。
[Abstract]:Aiming at the problem of outlier mining in data flow, based on K-means clustering algorithm, An outlier detection algorithm based on distance criterion is proposed to detect outliers in data streams. According to the results of data stream conceptual drift detection, the sliding window size is adjusted adaptively to realize outlier detection of data streams. A series of experiments and comparisons with other outliers show that the DOKM algorithm can effectively detect outliers in both artificial and real datasets.
【作者单位】: 南京邮电大学计算机学院;南京邮电大学通达学院;
【基金】:江苏省自然科学基金(No.BK20150868) 江苏省交通运输与安全保障重点实验室开放课题(No.TTS201502) 江苏省无线传感网高技术研究重点实验室开放课题(No.WSNLBZY201505) 南京邮电大学引进人才科研启动基金(No.NY214013);南京邮电大学通达学院大学生科技创新训练计划STITP(No.201513989010Y)
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 薛安荣;姚林;鞠时光;陈伟鹤;马汉达;;离群点挖掘方法综述[J];计算机科学;2008年11期
2 李存华;;l_∞度量意义下的离群点检测[J];淮海工学院学报(自然科学版);2008年02期
3 李昕;颜学峰;;融合离群点判别的稳态检测方法及其应用[J];华东理工大学学报(自然科学版);2009年01期
4 封海岳;薛安荣;;基于重叠模块度的社区离群点检测[J];计算机应用与软件;2013年05期
5 王柏钧,王力勤;《稳健回归与离群点检测》介绍[J];成都气象学院学报;1989年04期
6 黄添强;秦小麟;叶飞跃;;基于方形邻域的离群点查找新方法[J];控制与决策;2006年05期
7 熊君丽;;高维空间下基于密度的离群点探测算法实现[J];现代电子技术;2006年15期
8 黄添强;秦小麟;王钦敏;;空间离群点的模型与跳跃取样查找算法[J];中国图象图形学报;2006年09期
9 陈光平;叶东毅;;一种改进的离群点检测方法[J];福州大学学报(自然科学版);2007年03期
10 薛安荣;鞠时光;;基于空间约束的离群点挖掘[J];计算机科学;2007年06期
相关会议论文 前9条
1 张锋;常会友;;茫然第三方支持的隐私保持离群点探测协议[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 连凤娜;吴锦林;薛永生;;一种改进的基于距离的离群挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 梁雪琴;刘红生;代秀梅;周亚芬;;聚类离群点挖掘技术在内部审计信息化中的应用——一个来自商业银行信用卡审计的实例[A];全国内部审计理论研讨优秀论文集(2013)[C];2014年
4 于浩;王斌;肖刚;杨晓春;;基于距离的不确定离群点检测[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
5 许龙飞;熊君丽;段敏;;基于粗糙集的高维空间离群点发现算法研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 刘文远;李振平;王宝文;裴继辉;;一种多维数据的离群点检测算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
7 魏藜;钱卫宁;周傲英;;HOT:寻找高维空间中的离群点[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
8 周红福;钱卫宁;魏藜;周傲英;;EDOLOIS:高效准确的子空间局部离群点发现[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 魏藜;钱卫宁;周傲英;;SLOT:基于估计的高效子空间局部离群点发现[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
相关博士学位论文 前10条
1 Chitrakar Roshan;[D];武汉大学;2015年
2 刘莘;基于时空分析的CCS泄漏预警关键技术研究[D];中国矿业大学;2016年
3 杨鹏;离群检测及其优化算法研究[D];重庆大学;2010年
4 林海;离群检测及离群释义空间查找算法研究[D];重庆大学;2012年
5 薛安荣;空间离群点挖掘技术的研究[D];江苏大学;2008年
6 杨茂林;离群检测算法研究[D];华中科技大学;2012年
7 金义富;高维稀疏离群数据集延伸知识发现研究[D];重庆大学;2007年
8 雷大江;离群检测与离群释义算法研究[D];重庆大学;2012年
9 万家强;基于连通性的离群检测与聚类研究[D];重庆大学;2014年
10 唐向红;数据流离群点检测研究[D];华中科技大学;2010年
相关硕士学位论文 前10条
1 韩红霞;基于距离离群点的分析与研究[D];江苏大学;2007年
2 黄馨玉;基于邻域重心变化的离群点检测算法研究[D];辽宁大学;2015年
3 程百球;基于EP模式的离群点发现[D];安庆师范学院;2015年
4 欧阳根平;Hadoop云平台下基于离群点挖掘的入侵检测技术研究[D];电子科技大学;2015年
5 邓璇;数据流挖掘关键技术研究与实现[D];电子科技大学;2015年
6 周莹莹;利用离群点检测改进协同过滤推荐算法[D];南京邮电大学;2015年
7 陈娟;基于离群特征提取和能量计算的SVM股市预测研究[D];合肥工业大学;2014年
8 文静云;基于加权自然邻域属性和熵的离群检测研究[D];重庆大学;2015年
9 梅孝辉;基于聚类的离群点挖掘在入侵检测中的应用研究[D];重庆大学;2015年
10 秦浩;基于密度的局部离群点挖掘及在入侵检测中应用研究[D];大连海事大学;2016年
,本文编号:1617854
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1617854.html