类图像处理面向大数据XSS入侵智能检测研究
发布时间:2021-02-18 17:10
通过类图像处理方法对访问流量语料库大数据进行词向量化处理,实现面向大数据XSS入侵智能检测研究。利用类图像处理方法进行数据获取、数据清洗、数据抽样、特征提取等数据预处理;设计基于神经网络的词向量化算法,实现词向量化得到词向量大数据;通过理论分析和推导,实现多种不同深度的深层神经网络智能检测算法;设计不同的超参数并进行反复的实验,分别得到最高识别率、最低识别率、识别率均值、方差、标准差、识别率变化曲线图和平均绝对误差变化曲线图等结果。实验结果表明,该方法具有识别率高、稳定性好、总体性能优良等特点。
【文章来源】:计算机应用与软件. 2020,37(02)北大核心
【文章页数】:7 页
【部分图文】:
类图像处理大数据日志文本向量化原理图
(2) 构建基于神经网络的词向量化模型结构[5-9],包括输入层、投射层和输出层,利用输入样本,训练模型,获得分布式词向量,相应模型及训练过程如图2所示。(3) 统计正样本词集,用词频最高的3 000个词构成词库,其他标记为“COM”,本文设定分布式特征向量为128维度,当前词与预测词最大窗口距离为5,64个噪声词,进行5次迭代。
表1 各深层DNNs对第Ⅰ类大数据集进行20次实验得到的识别率 深度 3 4 5 6 7 1 0.988 1 0.991 1 0.989 5 0.983 9 0.989 0 2 0.993 6 0.993 6 0.993 7 0.993 8 0.993 5 3 0.994 1 0.993 9 0.993 5 0.994 0 0.993 5 4 0.994 6 0.993 9 0.993 8 0.993 0 0.993 6 5 0.994 5 0.994 5 0.994 4 0.993 6 0.993 6 6 0.994 5 0.994 6 0.994 7 0.993 9 0.993 8 7 0.994 5 0.994 7 0.994 7 0.994 2 0.993 6 8 0.994 5 0.994 8 0.994 7 0.994 3 0.993 9 9 0.994 6 0.994 9 0.994 9 0.994 4 0.994 1 10 0.994 9 0.994 8 0.995 1 0.994 4 0.994 3 11 0.995 2 0.994 8 0.995 1 0.994 3 0.994 4 12 0.995 2 0.995 1 0.995 2 0.992 2 0.994 3 13 0.995 3 0.994 8 0.995 0 0.992 6 0.994 4 14 0.995 2 0.994 9 0.994 7 0.993 1 0.994 4 15 0.995 1 0.995 2 0.994 6 0.993 1 0.992 5 16 0.995 5 0.995 4 0.995 0 0.993 1 0.987 0 17 0.995 0 0.995 4 0.994 8 0.993 1 0.988 1 18 0.995 1 0.995 1 0.994 8 0.993 1 0.990 9 19 0.995 4 0.994 5 0.994 3 0.993 1 0.990 9 20 0.995 5 0.995 1 0.995 0 0.993 1 0.990 9(2) 基于各深层DNN设计不同的超参数,对第Ⅱ类大数据集进行20次实验得到的识别率如表2所示。可以看出,最低识别率为0.986 4,最高识别率为0.999 0,识别率随着训练次数的增加而增加,最后也趋于稳定。曲线展示如图4所示。
本文编号:3039845
【文章来源】:计算机应用与软件. 2020,37(02)北大核心
【文章页数】:7 页
【部分图文】:
类图像处理大数据日志文本向量化原理图
(2) 构建基于神经网络的词向量化模型结构[5-9],包括输入层、投射层和输出层,利用输入样本,训练模型,获得分布式词向量,相应模型及训练过程如图2所示。(3) 统计正样本词集,用词频最高的3 000个词构成词库,其他标记为“COM”,本文设定分布式特征向量为128维度,当前词与预测词最大窗口距离为5,64个噪声词,进行5次迭代。
表1 各深层DNNs对第Ⅰ类大数据集进行20次实验得到的识别率 深度 3 4 5 6 7 1 0.988 1 0.991 1 0.989 5 0.983 9 0.989 0 2 0.993 6 0.993 6 0.993 7 0.993 8 0.993 5 3 0.994 1 0.993 9 0.993 5 0.994 0 0.993 5 4 0.994 6 0.993 9 0.993 8 0.993 0 0.993 6 5 0.994 5 0.994 5 0.994 4 0.993 6 0.993 6 6 0.994 5 0.994 6 0.994 7 0.993 9 0.993 8 7 0.994 5 0.994 7 0.994 7 0.994 2 0.993 6 8 0.994 5 0.994 8 0.994 7 0.994 3 0.993 9 9 0.994 6 0.994 9 0.994 9 0.994 4 0.994 1 10 0.994 9 0.994 8 0.995 1 0.994 4 0.994 3 11 0.995 2 0.994 8 0.995 1 0.994 3 0.994 4 12 0.995 2 0.995 1 0.995 2 0.992 2 0.994 3 13 0.995 3 0.994 8 0.995 0 0.992 6 0.994 4 14 0.995 2 0.994 9 0.994 7 0.993 1 0.994 4 15 0.995 1 0.995 2 0.994 6 0.993 1 0.992 5 16 0.995 5 0.995 4 0.995 0 0.993 1 0.987 0 17 0.995 0 0.995 4 0.994 8 0.993 1 0.988 1 18 0.995 1 0.995 1 0.994 8 0.993 1 0.990 9 19 0.995 4 0.994 5 0.994 3 0.993 1 0.990 9 20 0.995 5 0.995 1 0.995 0 0.993 1 0.990 9(2) 基于各深层DNN设计不同的超参数,对第Ⅱ类大数据集进行20次实验得到的识别率如表2所示。可以看出,最低识别率为0.986 4,最高识别率为0.999 0,识别率随着训练次数的增加而增加,最后也趋于稳定。曲线展示如图4所示。
本文编号:3039845
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3039845.html