不确定数据基于密度的局部异常点检测
本文关键词:不确定数据基于密度的局部异常点检测 出处:《计算机学报》2017年10期 论文类型:期刊论文
【摘要】:不确定数据作为一种新型的数据模型,被广泛应用于金融、基于位置的服务、移动物体监测、传感器网络等许多类型应用领域.近年来出现的面向不确定数据的分析处理技术已成为数据库、数据挖掘等领域的研究热点.许多传统的数据挖掘技术已经被扩展并应用到不确定数据的分析和管理,异常点检测是数据挖掘领域重要的技术,用来发现行为或特征不同于其他对象的数据对象.当数据对象的性质和行为明显区别于它的近邻时,则被为视为异常点.异常点检测在许多方面有着广泛的应用,如网络入侵检测、信用卡诈骗、环境监测等.该文研究不确定数据基于密度的局部异常点检测,每个不确定数据由几个离散的可能实例组成.首先,提出了基于特定不确定数据模型的局部异常点定义.为了能够快速地检测局部异常点,在不展开可能世界的前提下,提出了基础算法UDOL(Uncertain Density-based Local Outlier).然后,又提出在不精确计算概率的情况下,通过估计局部异常点因子的检测算法PUDOL(Pruning on Uncertain Density-based Local Outlier),可以有效地减少计算量.最后,通过大量的实验验证该文提出算法的性能.实验结果证明,该文所提出的算法是解决不确定数据基于密度的局部异常点检测的有效方法.
[Abstract]:As a new data model, uncertain data is widely used in finance, location-based services, mobile object monitoring. Sensor networks and many other types of applications. In recent years, uncertain data oriented analysis and processing technology has become a database. Many traditional data mining techniques have been extended and applied to the analysis and management of uncertain data. Anomaly point detection is an important technology in the field of data mining. Used to discover data objects whose behavior or characteristics are different from those of other objects. When the nature and behavior of a data object are significantly different from its immediate neighbors. Anomaly detection has been widely used in many fields, such as network intrusion detection, credit card fraud, environmental monitoring, etc. Each uncertain data consists of several discrete possible instances. Firstly, the definition of local outliers based on specific uncertain data model is proposed to detect local outliers quickly. Without expanding the possible world, the basic algorithm UDOL(Uncertain Density-based Local Outlier.Then. It is also proposed that the probability is calculated inaccurately. A detection algorithm PUDOL by estimating local outliers. Pruning on Uncertain Density-based Local Outlier. Finally, the performance of the proposed algorithm is verified by a large number of experiments. The algorithm proposed in this paper is an effective method for the detection of local outliers based on density in uncertain data.
【作者单位】: 沈阳建筑大学信息与控制工程学院;沈阳航空航天大学计算机学院;
【基金】:国家自然科学基金(611602323) 中国博士后科学基金(2016M591455) 辽宁省博士启动基金(201601209)资助~~
【分类号】:TP311.13
【正文快照】: 引 近年来,随着人们对数据采集和处理技术理解的不断深入,不确定数据得到了广泛的重视.在许多现实的应用中,普遍存在着不确定数据[1],例如基于位置的服务、传感器网络、射频识别等领域.由于不确定数据中存在着不确定性,传统的数据分析技术无法有效地处理不确定数据,这就引发
【相似文献】
相关期刊论文 前10条
1 申德荣;于戈;寇月;聂铁铮;;可能世界内数值型不确定数据匹配模型[J];计算机应用研究;2008年09期
2 崔斌;卢阳;;基于不确定数据的查询处理综述[J];计算机应用;2008年11期
3 徐雪松;;时间序列不确定数据流中异常数据检测方法[J];电子设计工程;2011年19期
4 徐雪松;李玲娟;郭立玮;;基于优化策略的不确定数据流预测方法[J];计算机工程;2011年21期
5 徐雪松;沈红红;陶帆;胡晓璐;崔伟;;基于小波分析的不确定数据流异常数据检测[J];软件导刊;2011年11期
6 钱江波;王志杰;陈华辉;王海斌;;不确定数据流自适应并行连接算法及应用[J];电信科学;2012年02期
7 向剑平;乔少杰;胡剑;;基于不确定数据理论的道路相关度度量方法[J];计算机工程与设计;2012年06期
8 蒋涛;高云君;张彬;周傲英;乐光学;;不确定数据查询处理[J];电子学报;2013年05期
9 王爽;杨广明;朱志良;;基于不确定数据的频繁项查询算法[J];东北大学学报(自然科学版);2011年03期
10 王意洁;李小勇;祁亚斐;孙伟东;;不确定数据查询技术研究[J];计算机研究与发展;2012年07期
相关会议论文 前10条
1 高聪;申德荣;于戈;聂铁铮;寇月;;一种基于不确定数据的挖掘频繁集方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 周逊;李建中;石胜飞;;不确定数据上聚集查询的分布式处理算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
3 王晓伟;黄九鸣;贾焰;;分布式不确定数据上的概率Skyline计算[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
4 艾文凯;张剡;柏文阳;;基于用户偏好的不确定数据阈值轮廓查询算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
5 陆叶;王丽珍;张晓峰;;从不确定数据集中挖掘频繁Co-location模式[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
6 孙永佼;王国仁;;P2P环境中不确定数据Top-k查询处理算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 张维;刘博;张小涛;;日内金融高频数据的异常点检测[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
8 刘晓艳;王丽珍;杨志强;陈红梅;;基于数学形态学的模糊异常点检测[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 王倩;刘奕群;马少平;茹立云;;面向用户互联网访问日志的异常点击分析[A];第五届全国信息检索学术会议论文集[C];2009年
10 王丽珍;周丽华;肖清;;基于数据仓库的动态异常点检测研究[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
相关博士学位论文 前10条
1 陈静玉;面向不确定数据流的聚类和模式挖掘技术研究[D];西安电子科技大学;2014年
2 曹科研;不确定数据的聚类分析与异常点检测算法[D];东北大学;2014年
3 李佳佳;不确定数据的概率近邻查询处理技术研究[D];东北大学;2014年
4 徐传飞;面向多维不确定数据的若干查询处理关键技术的研究[D];东北大学;2013年
5 罗昌银;位置及文本相关查询处理及验证策略研究[D];华中科技大学;2015年
6 张星;不确定数据和代价敏感学习研究[D];西北农林科技大学;2017年
7 汤克明;不确定数据流中频繁数据挖掘研究[D];南京航空航天大学;2012年
8 梁春泉;不确定数据流分类算法研究[D];西北农林科技大学;2014年
9 高明;不确定数据的世系管理和相似性查询[D];复旦大学;2011年
10 董俊;不确定数据中数据挖掘方法的研究[D];燕山大学;2012年
相关硕士学位论文 前10条
1 孙凤姣;概率XML数据文档的分发技术研究[D];大连海事大学;2015年
2 李雨明;不确定数据的挖掘算法研究[D];上海交通大学;2015年
3 曹庆傲;不确定性数据Top-k查询算法与实现[D];贵州大学;2015年
4 李红;不确定数据流查询处理算法的研究[D];黑龙江大学;2015年
5 甘果;基于不确定数据的范围查询算法的研究与实现[D];东北大学;2014年
6 张昕;基于分布式极限学习机的不确定数据流分类技术的研究与实现[D];东北大学;2014年
7 郎泓钰;面向不确定数据的最近邻分类方法研究[D];辽宁师范大学;2015年
8 赵超群;不确定数据质量评估系统的设计与实现[D];东北大学;2014年
9 梁s,
本文编号:1398846
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1398846.html