基于聚类离群因子和相互密度的离群点检测算法
发布时间:2021-02-03 11:42
针对大多基于聚类的离群点检测算法往往需要人工输入参数,对于不同的数据集很难选择一个合适参数的问题,将无参数的基于自然邻居的离群点检测算法的自然邻居搜索算法和密度峰值聚类算法相结合,提出一种基于聚类离群因子和相互密度的离群点检测算法。该算法使用相互密度和γ密度构造决策图,将γ密度异常大的样本点作为聚类中心进行聚类,最后根据聚类的离群因子找出离群聚类边界检测离群点,该算法不需要人工输入参数。在模拟数据集和真实数据集下进行了实验,证明了所提算法能很好地进行聚类和离群数据的挖掘。
【文章来源】:计算机集成制造系统. 2019,25(09)北大核心
【文章页数】:10 页
【文章目录】:
1 问题的提出
2 相关工作
2.1 NOF算法的相互邻居搜索算法
2.2 相互邻居搜索(MuN-Searching)算法的伪代码
2.3 DPC算法
3 COF算法
3.1 算法思想
3.2 相关定义
3.3 COF算法描述
3.4 COF算法复杂度分析
4 实验评估
4.1 实验指标
4.2 模拟数据集实验
4.3 真实数据集实验
5 结束语
【参考文献】:
期刊论文
[1]基于微粒群算法的上下文离群数据挖掘算法[J]. 王也,张继福,赵旭俊. 太原科技大学学报. 2015(05)
[2]基于累积全熵的子空间聚类离群点检测算法[J]. 张忠平,房春珍. 计算机集成制造系统. 2015(08)
[3]离群点挖掘研究[J]. 徐翔,刘建伟,罗雄麟. 计算机应用研究. 2009(01)
[4]局部离群点挖掘算法研究[J]. 薛安荣,鞠时光,何伟华,陈伟鹤. 计算机学报. 2007(08)
[5]基于粒子群的K均值聚类算法[J]. 刘靖明,韩丽川,侯立文. 系统工程理论与实践. 2005(06)
硕士论文
[1]基于聚类和密度的离群点检测方法[D]. 陶晶.华南理工大学 2014
本文编号:3016443
【文章来源】:计算机集成制造系统. 2019,25(09)北大核心
【文章页数】:10 页
【文章目录】:
1 问题的提出
2 相关工作
2.1 NOF算法的相互邻居搜索算法
2.2 相互邻居搜索(MuN-Searching)算法的伪代码
2.3 DPC算法
3 COF算法
3.1 算法思想
3.2 相关定义
3.3 COF算法描述
3.4 COF算法复杂度分析
4 实验评估
4.1 实验指标
4.2 模拟数据集实验
4.3 真实数据集实验
5 结束语
【参考文献】:
期刊论文
[1]基于微粒群算法的上下文离群数据挖掘算法[J]. 王也,张继福,赵旭俊. 太原科技大学学报. 2015(05)
[2]基于累积全熵的子空间聚类离群点检测算法[J]. 张忠平,房春珍. 计算机集成制造系统. 2015(08)
[3]离群点挖掘研究[J]. 徐翔,刘建伟,罗雄麟. 计算机应用研究. 2009(01)
[4]局部离群点挖掘算法研究[J]. 薛安荣,鞠时光,何伟华,陈伟鹤. 计算机学报. 2007(08)
[5]基于粒子群的K均值聚类算法[J]. 刘靖明,韩丽川,侯立文. 系统工程理论与实践. 2005(06)
硕士论文
[1]基于聚类和密度的离群点检测方法[D]. 陶晶.华南理工大学 2014
本文编号:3016443
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3016443.html