基于哈希编码的异常检测算法研究
发布时间:2024-01-17 18:34
如今信息技术的快速发展,数据呈现爆炸式的增长。然而由于仪器故障、自然环境、人为操作失误等各种因素,数据在收集过程中可能会出现一定的偏差或异常。检测并排除数据中的异常数据是数据挖掘的主要任务之一。由于能够检测数据中的异常数据及噪声,异常检测在现实中得到广泛应用,如欺诈检测、异常行为检测、医疗分析等。目前已提出许多异常检测算法,根据给定假设的不同,它们大致可分为:基于统计的异常检测算法、基于邻域的异常检测算法、基于聚类的异常检测算法、基于子空间的异常检测算法、基于分类的异常检测算法、基于孤立的异常检测算法。随着各个领域数据集规模不断的增加,基于邻域的异常检测算法的时间开销大大增加,使得该类算法存在效率较低的问题。针对此问题,常用的解决方法之一是使用高效的近邻搜索方法来检测异常数据,以保证一定程度上提高时间效率。哈希编码方法在近邻搜索中备受青睐,其原因在于它不仅具有较高的搜索效率和较低的存储空间需求,而且还能在数据编码过程中保留数据的原始近邻关系。因此,本文提出基于哈希编码的异常检测算法研究,研究工作包括如下:(1)本文提出了一种适用于数据规模大的异常检测算法—基于位置敏感哈希和随机游走的异...
【文章页数】:61 页
【学位级别】:硕士
本文编号:3879437
【文章页数】:61 页
【学位级别】:硕士
本文编号:3879437
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3879437.html