当前位置:主页 > 管理论文 > 移动网络论文 >

基于自编码器的未知协议分类方法

发布时间:2022-02-12 09:58
  针对互联网中存在的大量未知协议导致网络管理和维护网络安全十分困难的问题,提出了一种未知协议的分类识别方法。结合自编码器技术和改进的K-means聚类技术针对网络流量实现了未知协议的分类识别。利用自编码器对网络流量进行降维和特征提取,使用聚类技术对降维后数据进行无监督的分类,最终实现对网络流量的无监督识别分类。实验结果表明,所提方法分类效果优于传统的K-means、DBSCAN、GMM算法,且具有更高的效率。 

【文章来源】:通信学报. 2020,41(06)北大核心EICSCD

【文章页数】:10 页

【部分图文】:

基于自编码器的未知协议分类方法


自编码器模型

流量,数据,形式,长度


网络协议流量数据包含链路层数据、TCP/UDP头、应用层协议数据。本文进行协议识别主要是关注应用层协议头的部分数据,而不是关注载荷部分数据。因此只选择了包含协议头部的数据分组作为分类的流量数据。协议流量数据形式如图3所示,每一条数据都是一帧流量。为了保证输入数据长度固定,需要将输入数据进行截断和填充。例如,选择长度l作为输入长度,需要对长度短于l的消息数据进行阶段处理,对其填充0使长度为l。这样会导致数据的损失和噪声的产生。选择的长度需要在减少数据损失和噪声产生的基础上尽可能选取全部有效的控制信息。对于数据集I=(m 1,m 2,m 3,,m n),这里每个数据对象mi=(m i1,m i2,m i3,,mij,mi mi)为不定长的消息,其中mij代表消息mi的第j个字节。为了保证能够不损失有效信息并减少填充噪声,截取长度l设定为

流程图,无监督,编码器,流程


其中,t是包括所有控制信息的最短长度。为了便于数值计算,需要将长度对齐后的数据集从十六进制转化为十进制。为了便于训练神经网络时进行矩阵运算,需要将向量进行归一化操作,如式(3)所示。4.2 DEC模型

【参考文献】:
期刊论文
[1]基于连续特征的未知协议消息聚类算法[J]. 卢政宇,李光松,申莹珠,张彬.  山东大学学报(理学版). 2019(05)



本文编号:3621512

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3621512.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ff970***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com