基于级联方法的图像型垃圾邮件过滤系统的设计与实现

发布时间:2021-07-08 00:22
  近些年来,垃圾邮件制造者为了躲避基于邮件文本的传统垃圾邮件过滤系统的拦截,将特定宣传目的的垃圾信息嵌入到图片中,并通过邮件的形式群发给个人和企业用户。这类邮件是一种新型的垃圾邮件,统称为图像型垃圾邮件(Image Spam)。同文本型垃圾邮件相比,图像型垃圾邮件通常含有大量的垃圾信息,如具有特定目的政治宣传信息、宗教宣传和广告推销信息等,这给个人和企业用户带来较大困扰,给正常的工作与生活带来不利的影响。图像型垃圾邮件的标识与过滤已经成为了信息安全领域的研究热点,对图像型垃圾邮件过滤技术的研究具有重要的现实意义。现有的基于邮件文本的传统垃圾邮件过滤系统不能有效的过滤图像型垃圾邮件,因此需要一个系统去高效和准确地过滤图像型垃圾邮件,来完善和补充现有的垃圾邮件过滤系统。本文的研究对象是图像型垃圾邮件中的图像,下文简称为垃圾图像。本文在分析和归纳了垃圾图像的典型特征的基础上,设计了一个递进式的、基于级联方法的并带有反馈机制的双层过滤系统,第一层采用基于垃圾图像近似匹配的过滤方法,第二层采用深度学习中的卷积神经网络方法进行图像分类,实现垃圾图像的过滤。本文的主要工作如下:首先,根据垃圾图像大多是... 

【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

基于级联方法的图像型垃圾邮件过滤系统的设计与实现


CNN的基本结构

二维图像,尺度空间,高斯,金字塔


味约?档憬?芯?罚?コ?衾嗉?档悖?缓蠖ㄒ寮?档愕姆?向,最后得到图像局部的特征点,由特征点生成对图像尺度变换及旋转保持不变的特征描述子。(1)构建图像尺度空间:在数字图像处理中,尺度空间指是计算机图像处理模型中的一个工具,它在模型中引入了一个尺度参数,随着这个参数的连续变化,可以得到在不同尺度下的特定图像序列。与此同时,对这些图像序列根据尺度大小进行模糊程度变化的高斯操作,以此来模拟目标在人眼视网膜中的成像过程。在SIFT算法中是通过构建图像的高斯金字塔来实现图像尺度空间。高斯金字塔如图3.2所示。尺度空间可由像素与高斯核函数的卷积得到,然后在尺度空间中,寻找极值点,通过极大值抑制,得到稳定的极值点。图3.2图像高斯金字塔构造尺度空间:一幅二维图像(,)的尺度空间(,,)可由公式3.1式表示。(,,)=(,,)(,)(3.1)其中是尺度空间参数,为卷积操作,(,,)为高斯核函数,定义为:(,,)=122(2+222)(3.2)利用公式3.1对图像进行高斯平滑处理,得到一个图像高斯金字塔,这是初步构造的尺度空间。为了找到更加稳定的图像关键点,由高斯金字塔(LaplacianofGaussian,LoG)进一步优化并构造高斯差分金字塔(DifferenceofGaussian,DoG),公式(3.3)所示:

极值点,离散空间


第三章基于近似匹配的垃圾图像检测过滤方法21(,,)=[(,,)(,,)](,)=(,,)(,,)(3.3)其中为阈值,由此可在构建的DoG金字塔中寻找可能的极值点。通过像素点与其点周围8个相邻点,以及向下相邻尺度空间的9×2个点,总共26个点相比较来选取极大或极小值点。精确定位特征点:在高斯差金字塔中检测得到的极值点是在离散的尺度空间里得到的,高斯差分函数确定的极值点很可能不是真正意义上的极值点,也有可能是附近的点,因此会产生边缘效应。为了消除这种影响,SIFT算法的机制是拟合一个高次函数来寻找真正的极值点,如图3.3所示,通过这种方式,增强了算法的稳定性。图3.3离散空间中的极值点与真实极值点的区别特征点方向的确定:SIFT算法是通过计算高斯差分金字塔中的到的极值点邻域的梯度方向,该方向指定为特征点方向,使得由特征点生成的特征描述子具有尺度不变性。在DoG中检测出的关键点,在其领域高斯金字塔图的3邻域窗口内计算梯度幅值(,)及方向(,):(,)=√[(+1,)(1,)]2+[(,+1)(,1)]2(3.4)(,)=((,+1)(,1)(+1,)(1,))(3.5)到这里,完成了极值点的检测,考虑的因素有特征点的位置、方向和尺度。图3.4图像梯度和关键点描述


本文编号:3270664

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3270664.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7979a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com