可变融合的随机注意力胶囊网络入侵检测模型
发布时间:2022-01-17 02:20
为了增强检测模型的准确率与泛化性,提出了一种可变融合的随机注意力胶囊网络的入侵检测模型,通过特征动态融合,模型能够更好地捕捉数据特征;同时使用随机注意力机制,减少了对训练数据的依赖,使模型更具有泛化能力。所提模型在NSL-KDD和UNSW-NB15数据集上进行验证,实验表明,模型在2种测试集上的准确率分别达到了99.49%和98.60%。
【文章来源】:通信学报. 2020,41(11)北大核心EICSCD
【文章页数】:9 页
【部分图文】:
随机注意力机制
本文中的动态路由机制的与文献[11]中相似,但是为了使动态过程更加接近入侵检测的数据,本文对压缩函数Squashing进行了修改,如图3所示。使用x和y分别代表压缩函数中的sj和vj,x和y都是标量,在二维坐标系下研究函数的性质。从图3中可以发现,原始的压缩函数在处理模长较短的胶囊时,会把数值压缩到0附近,这样的全局压缩会导致在迭代更新时丢失部分胶囊的重要信息,同时函数增长速率过缓,对于模长比较短和模长比较长的胶囊会有明显的区分,但却不能很好地区分中间长度的胶囊,并且影响迭代速度。为了解决这个问题,本文对原来的压缩方法进行了调整,改进的压缩方法如式(12)所示,函数图像如图4所示。此压缩函数的特点是在模长接近0时起到了放大作用,不像原来函数一样进行全局压缩,导致部分信息被忽略。
为了解决这个问题,本文对原来的压缩方法进行了调整,改进的压缩方法如式(12)所示,函数图像如图4所示。此压缩函数的特点是在模长接近0时起到了放大作用,不像原来函数一样进行全局压缩,导致部分信息被忽略。在输出层部分,本文并没有采用原始胶囊网络中的重构操作,因为在特征提取过程中融合了全局特征,重构后将会带来一定的误差,分类的预测结果依旧采用vj模长的形式来表示,在损失函数部分,本文只使用了如式(13)所示的Margin Loss函数。
本文编号:3593858
【文章来源】:通信学报. 2020,41(11)北大核心EICSCD
【文章页数】:9 页
【部分图文】:
随机注意力机制
本文中的动态路由机制的与文献[11]中相似,但是为了使动态过程更加接近入侵检测的数据,本文对压缩函数Squashing进行了修改,如图3所示。使用x和y分别代表压缩函数中的sj和vj,x和y都是标量,在二维坐标系下研究函数的性质。从图3中可以发现,原始的压缩函数在处理模长较短的胶囊时,会把数值压缩到0附近,这样的全局压缩会导致在迭代更新时丢失部分胶囊的重要信息,同时函数增长速率过缓,对于模长比较短和模长比较长的胶囊会有明显的区分,但却不能很好地区分中间长度的胶囊,并且影响迭代速度。为了解决这个问题,本文对原来的压缩方法进行了调整,改进的压缩方法如式(12)所示,函数图像如图4所示。此压缩函数的特点是在模长接近0时起到了放大作用,不像原来函数一样进行全局压缩,导致部分信息被忽略。
为了解决这个问题,本文对原来的压缩方法进行了调整,改进的压缩方法如式(12)所示,函数图像如图4所示。此压缩函数的特点是在模长接近0时起到了放大作用,不像原来函数一样进行全局压缩,导致部分信息被忽略。在输出层部分,本文并没有采用原始胶囊网络中的重构操作,因为在特征提取过程中融合了全局特征,重构后将会带来一定的误差,分类的预测结果依旧采用vj模长的形式来表示,在损失函数部分,本文只使用了如式(13)所示的Margin Loss函数。
本文编号:3593858
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3593858.html