深度随机神经网络单分类器理论、算法与应用研究
发布时间:2021-01-24 19:10
单分类(One-Class Classification)算法旨在建立针对目标数据的分类模型,学习目标数据的特征并得到识别模型,用来检测异常样本。它在许多应用场景有着优越的性能,如异常检测、不均衡数据集分类识别等。代表性的单分类算法主要有支撑向量机单分类算法(OC-SVM),支撑向量数据描述(SVDD),朴素帕森密度估计(Naive Parzen density estimation),自编码器(Autoencoder)等。但现有的单分类算法,在复杂或高维大数据集等分类场景中性能较差。因此,如何提升现有单分类算法的性能以便于为将来的实际应用提供可能性,是亟待解决的问题。近年来,由于基于超限学习机单分类算法(One-Class Extreme Learning Machine,OC-ELM)的优异性能。本文深入研究了OC-ELM并对其进行改进,论文的创新主要围绕提升单分类器对复杂数据集的表征能力,模型泛化能力以及抗干扰噪声能力等方面展开。主要工作和成果如下:1.针对浅层网络对复杂或高维大数据集表征能力不足的缺点,构建基于多层堆叠自编码器的深度神经网络模型。同时为了加快学习速度,采用基于超...
【文章来源】:杭州电子科技大学浙江省
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
高斯分布
杭州电子科技大学硕士学位论文基于深度的方法,即从点空间的边缘定位异常点,按照实际需求决定层数及异常点的个数。如下图所示,圈中密密麻麻的黑点代表一个个数据点,基于的假设是点空间中心这些分布比较集中、密度较高的点都是正常点,而异常点都位于外层,即分布比较稀疏的地方。如下图所示,最外层点图1.2:点空间分布的深度为1,再往内几层深度一次为2、3、4...若设置阈值k=2,那么深度小于等于2的点就全部为异常点。这一方法最早由Tukey在1997年首次提出[56]。但这个基础模型仅适用于二维、三图1.3:点空间深度维空间。现在有很多流行的算法都借鉴了这种模型的思想,通过改变计算深度的方式,可以实现高维空间的异常检测,如孤立森林算法[60]。(3)基于偏差的方法这是一种比较简单的统计方法,最初是为一维异常检测设计的。给定一个数据集,对每个点进行检测,如果一个点自身的值与整个集合的指标存在过大的偏差,则该点为异常点。具体的实现方法是,定义一个指标SF(SmoothFactor),这个指标就是把某个点从集合剔除后方差所降低的差值。通过设定一个阈值,与这些偏差值进行比较来确定哪些点存在异常。这个方法是由Arning在1996年首次提出的[5]。-3-
杭州电子科技大学硕士学位论文基于深度的方法,即从点空间的边缘定位异常点,按照实际需求决定层数及异常点的个数。如下图所示,圈中密密麻麻的黑点代表一个个数据点,基于的假设是点空间中心这些分布比较集中、密度较高的点都是正常点,而异常点都位于外层,即分布比较稀疏的地方。如下图所示,最外层点图1.2:点空间分布的深度为1,再往内几层深度一次为2、3、4...若设置阈值k=2,那么深度小于等于2的点就全部为异常点。这一方法最早由Tukey在1997年首次提出[56]。但这个基础模型仅适用于二维、三图1.3:点空间深度维空间。现在有很多流行的算法都借鉴了这种模型的思想,通过改变计算深度的方式,可以实现高维空间的异常检测,如孤立森林算法[60]。(3)基于偏差的方法这是一种比较简单的统计方法,最初是为一维异常检测设计的。给定一个数据集,对每个点进行检测,如果一个点自身的值与整个集合的指标存在过大的偏差,则该点为异常点。具体的实现方法是,定义一个指标SF(SmoothFactor),这个指标就是把某个点从集合剔除后方差所降低的差值。通过设定一个阈值,与这些偏差值进行比较来确定哪些点存在异常。这个方法是由Arning在1996年首次提出的[5]。-3-
本文编号:2997777
【文章来源】:杭州电子科技大学浙江省
【文章页数】:88 页
【学位级别】:硕士
【部分图文】:
高斯分布
杭州电子科技大学硕士学位论文基于深度的方法,即从点空间的边缘定位异常点,按照实际需求决定层数及异常点的个数。如下图所示,圈中密密麻麻的黑点代表一个个数据点,基于的假设是点空间中心这些分布比较集中、密度较高的点都是正常点,而异常点都位于外层,即分布比较稀疏的地方。如下图所示,最外层点图1.2:点空间分布的深度为1,再往内几层深度一次为2、3、4...若设置阈值k=2,那么深度小于等于2的点就全部为异常点。这一方法最早由Tukey在1997年首次提出[56]。但这个基础模型仅适用于二维、三图1.3:点空间深度维空间。现在有很多流行的算法都借鉴了这种模型的思想,通过改变计算深度的方式,可以实现高维空间的异常检测,如孤立森林算法[60]。(3)基于偏差的方法这是一种比较简单的统计方法,最初是为一维异常检测设计的。给定一个数据集,对每个点进行检测,如果一个点自身的值与整个集合的指标存在过大的偏差,则该点为异常点。具体的实现方法是,定义一个指标SF(SmoothFactor),这个指标就是把某个点从集合剔除后方差所降低的差值。通过设定一个阈值,与这些偏差值进行比较来确定哪些点存在异常。这个方法是由Arning在1996年首次提出的[5]。-3-
杭州电子科技大学硕士学位论文基于深度的方法,即从点空间的边缘定位异常点,按照实际需求决定层数及异常点的个数。如下图所示,圈中密密麻麻的黑点代表一个个数据点,基于的假设是点空间中心这些分布比较集中、密度较高的点都是正常点,而异常点都位于外层,即分布比较稀疏的地方。如下图所示,最外层点图1.2:点空间分布的深度为1,再往内几层深度一次为2、3、4...若设置阈值k=2,那么深度小于等于2的点就全部为异常点。这一方法最早由Tukey在1997年首次提出[56]。但这个基础模型仅适用于二维、三图1.3:点空间深度维空间。现在有很多流行的算法都借鉴了这种模型的思想,通过改变计算深度的方式,可以实现高维空间的异常检测,如孤立森林算法[60]。(3)基于偏差的方法这是一种比较简单的统计方法,最初是为一维异常检测设计的。给定一个数据集,对每个点进行检测,如果一个点自身的值与整个集合的指标存在过大的偏差,则该点为异常点。具体的实现方法是,定义一个指标SF(SmoothFactor),这个指标就是把某个点从集合剔除后方差所降低的差值。通过设定一个阈值,与这些偏差值进行比较来确定哪些点存在异常。这个方法是由Arning在1996年首次提出的[5]。-3-
本文编号:2997777
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2997777.html