网络流量分类识别若干技术研究
发布时间:2018-04-19 22:32
本文选题:网络流量分类识别 + 机器学习 ; 参考:《电子科技大学》2014年博士论文
【摘要】:近年来,信息科学领域发展迅速,许多新兴技术特别是基于TCP/IP协议的互联网的广泛应用,已经深刻地改变了人们的生活方式,互联网正日益成为人类社会不可或缺的重要基础设施之一。而伴随着网络技术的不断发展、网络带宽的不断增加,网络流量分类识别技术作为网络管理与网络分析的基础,在网络安全、网络服务质量测评等领域都具有广泛的应用前景,是目前计算机网络研究的重要领域之一。网络流量涉及到主机、网络、应用以及用户等多个相互紧密联系的实体,是一个多因素融合的、复杂的系统概念。每个网络应用都有自己相应的流量行为特性,随着各种网络新型应用和网络应用层协议的不断出现,网络流量的复杂性也日益增加,其多变、动态、异质的特性也更加明显。同时,动态端口传输、数据传输加密等新兴技术的广泛应用也对网络流量分类识别提出了巨大的挑战,此外,网络数据具有一定的时间性和地域性,所以其自身行为特征变化也比较大,这些都会对流量分类识别造成一定的影响。本文系统地回顾了网络流量分类识别的发展历程,归纳了国际标准化组织、各研究机构和网络运营商在网络流量分类识别方面所取得的重要成果,指出在当前网络快速发展的背景下进行大规模网络流量分类识别研究的重要意义。本文对网络流量分类识别方法及模型的构建、网络流量类型分析等领域中的几个关键方法及相关技术进行了深入研究,主要内容包括:(1)基于贝叶斯更新的网络流量分类识别方法,许多分类算法没有考虑到数据随时间变化,流量行为特征也在发生变化,为了保证分类模型识别的精度和有效性,需要准确地根据流量的变化而随时做出相应的调整。本文提出一种贝叶斯更新策略机制,在网络流量分类识别过程中,通过在贝叶斯模型中加入更新机制以满足随流量数据集的不断变化,分类模型也相应更新,利用模型的更新提升分类的整体性能,并保证数据的一致性和模型应用的稳定性。(2)基于神经网络的分类识别方法研究,随着网络数据的不断变化,数据中难免会出现一些“噪声数据”,而神经网络对输入数据的噪声体现出较强的容错性,且具有一定的自适应和自组织能力。本文首先提出一种基于有监督学习的神经网络分类模型,采用贝叶斯规整化原则并利用FCBF属性选择算法优化属性测度分布,以提高分类的总体准确率。随后,本文构建一个SOM和PNN相融合的网络流量分类识别模型,通过SOM对PNN输入空间的数据进行计算,提高了分类效率,其参考向量保留了原训练样本集的特征,有利于提高模型分类识别的精度,通过PNN直接给出概率分类识别结果,也弥补了SOM不能直接显示分类识别结果的缺点,提高了系统的实用性。理论分析和实验结果都表明,所构建的分类模型可以实现流量分类识别性能的优化并获取有效的高精度的识别结果。(3)基于谱聚类的网络流量分类识别方法研究,该方法把网络流量分类识别问题通过聚类思想转化为一个无向图的多路划分问题,并且利用拉普拉斯矩阵作为工具,最终使用图论的思想来解决流量分类的问题。实验结果表明该方法具有良好的流量分类识别效果,精确度较高,并且,相对于分类方法,聚类思想能够发现网络流量中新的网络应用类型。(4)基于机器学习的半监督流量分类识别方法研究,本文首先利用有效载荷分析方法对网络流进行标记并以此作为识别监督信息,然后对未标记的网络流量使用聚类算法进行识别并利用已标记的监督信息完成相关类簇的标记匹配。算法考虑到样本数据的全局一致性需求,通过密度敏感的相似性函数对K均值算法初始簇中心的选取提出改进,以获取更优的聚类划分簇,并通过最大似然估计方法标记聚类结果实现与相关应用类型或协议的对应匹配过程,实验数据分析表明该方法提升了流量分类识别结果的有效性和准确性。(5)基于宏观流量模型进行网络传输行为和网络流量动态变化信息的分析,从宏观角度了解流量行为特征,为网络流量分类识别提供更多的辅助信息,实验结果表明,宏观层面的网络流行为量化分析有助于了解网络流宏观的行为特征动态变化规律及网络整体变化趋势以更好地为网络拥塞控制管理、流量均衡管理、网络性能分析与预测、高性能的网络协议设计与实施等网络管理活动提供支持。
[Abstract]:In recent years , the rapid development of information science and the application of many emerging technologies , especially the Internet based on TCP / IP protocol , have profoundly changed people ' s life style . This paper presents a classification model of network traffic based on supervised learning , which can be used as a tool to improve the accuracy of classification . ( 5 ) Based on the analysis of network transmission behavior and network traffic dynamic change information based on macro flow model , the characteristics of traffic behavior are known from the macroscopic angle , and more auxiliary information is provided for the classification and identification of network traffic . The experimental results show that the network popularity in the macro level can help to understand the dynamic change law of network flow and the overall trend of the network , so as to provide support for network management activities such as network congestion control management , flow equalization management , network performance analysis and prediction , high performance network protocol design and implementation .
【学位授予单位】:电子科技大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:TP393.06
,
本文编号:1775055
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1775055.html