基于邻域离散度的异常点检测算法
本文关键词:基于邻域离散度的异常点检测算法
【摘要】:异常点检测在机器学习和数据挖掘领域中有着十分重要的作用。当前异常点检测算法的一大缺陷是正常数据在边缘处异常度较高,导致在某些情况下误判异常点。为了解决该问题,提出了一种新的基于邻域离散度的异常点检测算法。该算法将数据点所在邻域的离散度作为该数据点的异常度,既能有效避免边缘数据点的异常度过高,又能较好地区分正常点与异常点。实验结果表明,该算法能够有效地检测数据中的异常点,并且算法对参数选择不敏感,性能较为稳定。
【作者单位】: 浙江师范大学数理与信息工程学院;
【关键词】: 异常点检测 机器学习 数据挖掘 主成分分析
【基金】:国家自然科学基金Nos.61272007,61272468,61572443 浙江省自然科学基金No.LY14F020012 浙江省教育厅项目No.Y201328291~~
【分类号】:TP391.41
【正文快照】: 1 引言 随着数字化技术的发展,人们收集到的数据越来越多。然而由于仪器故障、信号干扰、反常行为等因素,数据中通常存在异常点。异常点和其余数据点之间存在显著差异,一方面会干扰特征提取、模式识别等机器学习任务,另一方面又有助于发现信用卡欺诈、基因突变、网络入侵等异
【相似文献】
中国期刊全文数据库 前10条
1 陶运信;皮德常;;屏蔽输入参数敏感的异常点检测新方法[J];计算机科学;2008年12期
2 陶运信;皮德常;;基于邻域和密度的异常点检测算法[J];吉林大学学报(信息科学版);2008年04期
3 张春生;李艳;王海珍;张世铮;;基于纵横距离的单纯异常点检测算法及应用[J];内蒙古民族大学学报(自然科学版);2009年04期
4 颜庆茁;Java的异常设计原则[J];集美大学学报(自然科学版);2004年02期
5 王洪春;彭宏;;一种基于主成分分析的异常点挖掘方法[J];计算机科学;2007年10期
6 刘洪涛;童德利;陈世福;;一种基于属性的异常点检测算法[J];计算机科学;2005年05期
7 陆介平;倪巍伟;孙志挥;;基于关联分析的高维空间异常点发现[J];应用科学学报;2006年01期
8 苏卫星;朱云龙;刘芳;胡琨元;;时间序列异常点及突变点的检测算法[J];计算机研究与发展;2014年04期
9 卢鸣;;基于异常点处理和自劈分合并学习的聚类方法[J];福建电脑;2008年12期
10 王元明;熊伟;;异常数据的检测方法[J];重庆工学院学报(自然科学版);2009年02期
中国重要会议论文全文数据库 前5条
1 张维;刘博;张小涛;;日内金融高频数据的异常点检测[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
2 刘晓艳;王丽珍;杨志强;陈红梅;;基于数学形态学的模糊异常点检测[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 王倩;刘奕群;马少平;茹立云;;面向用户互联网访问日志的异常点击分析[A];第五届全国信息检索学术会议论文集[C];2009年
4 王丽珍;周丽华;肖清;;基于数据仓库的动态异常点检测研究[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 张重生;冯海军;陈红;梁思维;李翠平;;一种分布式数据集上top-n异常点挖掘的高效算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
中国硕士学位论文全文数据库 前10条
1 何欢;基于概念漂移的异常检测技术研究[D];电子科技大学;2015年
2 杨宗羲;函数系数时序模型基于各类进化算法的估计及其异常点检测[D];东南大学;2015年
3 赵伯夷;基于神经网络的异常点挖掘[D];河北大学;2011年
4 孙易木;异常点挖掘及证券行业应用实例研究[D];同济大学;2006年
5 曹忠虔;时间序列异常检测的研究[D];电子科技大学;2012年
6 彭珊;线性回归模型中关于异常点的若干问题的分析[D];东北林业大学;2014年
7 杨金伟;基于距离和信息熵的不确定异常点检测研究[D];云南大学;2011年
8 庄雪鹏;基于小波的时间序列中异常点的检测[D];南京大学;2013年
9 王康宁;贝叶斯方法下二值与多值序次数据模型与异常点的同时识别[D];苏州大学;2011年
10 张洋;一种基于热计量数据的异常点挖掘算法研究[D];燕山大学;2012年
,本文编号:751587
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/751587.html