当前位置:主页 > 科技论文 > 自动化论文 >

基于神经网络的TOR网络网站指纹分析

发布时间:2020-07-16 23:01
【摘要】:TOR(The Onion Router)网络是广泛使用的一款基于链路的低延迟且开源免费的匿名通信网络软件。然而,它的普及也使得网络的犯罪层出不穷难以监管。网站指纹分析技术作为当前针对TOR网络去匿名化分析最有效的手段,其准确率一直受限于人工构建的特征集。特征集的构建要求使用者必须具备丰富的经验和专家知识。基于现阶段网站指纹分类技术受限于人工分析特征的缺点,提出了利用神经网络自学习特征的网站指纹分类模型。论文首先提出了一种TCP(Transmission Control Protocol)层之上数据表示方式,能够更好的反应TOR匿名网络的数据传输。之后,基于新的数据表示方式提出了一种基于长短期记忆神经网络的网站指纹分类模型用于拟合网络数据包序列的有序特征和难以量化分析的时间特征。最后,在长短期记忆神经网络模型的实验基础上结合神经网络普遍面临的数据限制问题,构建了一种新的基于卷积神经网络的网站指纹分析模型。其核心思想在于利用空洞卷积提高神经网络的感受视野,提高模型表现。根据上述的想法实现了原型系统,并对原型系统进行了测试。实验结果表明,基于神经网络的网站指纹分析模型比传统的人工模型更加健壮,更能拟合TOR网络数据包序列的特征,尤其是在更符合实际环境的open_world测试中比传统模型高出3%-4%。与同类型的自学习特征的其他神经网络模型比较中,论文构建的神经网络分类模型也表现更优。最后,通过对卷积神经网络中的空洞卷积的有效性进行了测试,证明了将TOR网络数据包视为有序序列能够有效提高网站指纹模型的表现。综上所述,利用神经网络学习TOR网络数据包序列的特征是高效可行的。
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP183;TP393.08
【图文】:

序列,视野计


CNN 网络相较于 LSTM 能够处理较大维度的输入数据,避免了对数据进行截断和处理时造成的数据信息丢失。训练的时间花费和硬件花费相较于 LSTM 来说也减少了很多。但是将 CNN 网络用于处理 TOR 网络数据包序列也存在着一些问题。最大的问题就是 CNN 网络会丢失到输入数据之间的联系和特征。CNN 网络将输入数据的每个点都视为一个个独立的点,点与点之间的联系被其全部忽略了。这样的处理显然不符合具有有序特征的数据包序列。当用户访问特定的目标网站时,依据 HTTP 协议的工作机制,浏览器会依次加载不同的内容。这些内容会因为网站内容的更新而发生变化,但是加载的顺序确是相对固定。如果 CNN 网络在处理数据时丢失掉了这些重要的顺序信息,那么必然会影响最终的分类准确率。针对 CNN 网络处理 TOR 网络数据序列时的难点,本文对 CNN 网络进行调整以便其能更好的学习到 TOR 网络数据包序列的特征。3.5.2.1 提高 CNN 网络的感受视野

卷积,卷积和,参数,卷积核


图 3-8 空洞卷积如图3-8所示,图a表示当空洞参数设为1时,此时的卷积和正常的卷积没有区别。图 b 中则将空洞参数设为 2,此时可以将其看作 7 x 7 大小的 kernel,但是这个卷积核中只有 9 个点的参数不为 0,其他的参数值都是 0。现在的实际参数只有 3 x 3 但此时的感受野却增加到了 7 x 7。如果将图 a 看作是图 b 卷积层的前一层的话,那么每个红点可以看作是图 a 的卷积输出,那么将图 a 和图 b 这两个卷积层堆叠在一起就能达到 7X 7 的感受视野。同理将图 c 堆叠在图 a 和图 b 之后就能在同样参数规模的卷积核下使神经元的感受视野增加到了 15 x 15。相较于传统的卷积操作中神经元的感受野随着层数的增加而线性增加的情况

示意图,模型,示意图,卷积


图 4-1 CNN 模型示意图CNN 模型的其他参数如表 4-4 所示,由于 CNN 网络的输入维度必须固定,因此文将 CNN 网络的输入维度设为 4000,这使得数据集中的 2750 条访问数据包序列需被截断,15250 条访问数据包序列需要被填充。注意:使用 0 来填充数据包序列。 后网络的学习率会随着训练的进程而进行衰减,每 50 个 epoch 衰减 0.1。表 4-4 CNN 参数说明Epoc Inputs Batch Opt LR Layers Drop_conv Drop_dense200 4000 50 Rmsprop 0.0001 12 0.1 0.5如图 4-2 所示,为了测试空洞卷积对于模型准确率的影响,本文建立了另一个层的 CNN 网络模型,用于对比不同空洞卷积参数下的模型表现。对比模型中,所有参数设置都与原模型相同,只是减小了模型的层数使得空洞卷积的参数只循环了2次这样两个模型在神经元的感受视野就会有差距,通过比较不同感受视野下的模型表从而验证学习数据包序列之间联系的重要性,说明在构建 CNN 网络时加入空洞卷积

【相似文献】

相关期刊论文 前10条

1 胡悦;;金融市场中的神经网络拐点预测法[J];金融经济;2017年18期

2 迟惠生;陈珂;;1995年世界神经网络大会述评[J];国际学术动态;1996年01期

3 王方;苗放;陈垦;;基于优化神经网络的地质灾害监测预警仿真[J];计算机仿真;2019年11期

4 马猛;王明红;;基于进化神经网络的304不锈钢车削加工表面粗糙度预测[J];轻工机械;2019年06期

5 庄连生;吕扬;杨健;李厚强;;时频联合长时循环神经网络[J];计算机研究与发展;2019年12期

6 李杰;孙仁诚;;几种典型卷积神经网络的权重分析与研究[J];青岛大学学报(自然科学版);2019年04期

7 岳新;杜玉红;蔡文超;;基于GA-BP神经网络异纤分拣机检测参数优化[J];棉纺织技术;2020年01期

8 赵伟荣;李慧;;基于集成神经网络的织物主观风格预测研究[J];纺织科技进展;2020年01期

9 李金堂;;试析神经网络技术在机械工程中的应用及发展[J];网络安全技术与应用;2020年02期

10 吴立可;;脉冲神经网络和行为识别[J];通讯世界;2018年12期

相关会议论文 前10条

1 孙军田;张U

本文编号:2758622


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2758622.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户49998***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com