基于混合方法的网络流量分类技术研究
本文选题:网络流量分类 + 重组方法 ; 参考:《哈尔滨理工大学》2014年硕士论文
【摘要】:已有的网络流量分类技术包括基于端口、基于载荷、基于流量统计特征、基于行为以及基于流量传播图等方法。大部分新的应用使用动态端口,导致基于端口的分类方法准确率低于50%。基于载荷的分类方法由于其较高的时间和空间复杂度,不适用高速链路的分类,也不能识别加密流量。基于流量统计特征和机器学习的分类方法在实时网络流量分类中具有较差的鲁棒性。基于行为和基于流量传播图的分类方法不适用于实时流量分类。因此,研究新的网络流量分类方法,尤其是多种分类技术的混合方法,对满足当今网络环境下快速、准确、应用多样化的流量分类要求很有必要。基于正则表达式的分类方法需要顺序的载荷,基于流量统计特征与机器学习的分类方法需要顺序的网络流特征。然而针对TCP数据流,己有的TCP数据流重组方法不能处理SYN包丢失、FIN包丢失以及数据包丢失的情况。因此,本文首先提出了一种基于滑动窗口的TCP数据流重组方法,重点解决在丢包情况下的重组,很大程度上提高了重组效率。单独的使用基于端口和基于载荷的分类方法不能同时满足快速和准确的分类要求,因此,本文结合基于端口分类技术的快速性和基于载荷分类技术的准确性,提出了一种基于单向监督与概率衰减的分类方法,实现了在实时流量下快速、准确的分类。在该方法基础之上,本文又提出了一种高性能的层次化网络流量分类框架,融合了多种分类技术,不同分类模块之间反馈分类结果并相互指导,从而满足快速、准确、应用多样化的分类要求。在该框架基础之上,本文研究并开发了一套开源的网络流量分类与对比基准平台OpenNTCB,该平台包含了从网络数据的前期预处理到后期分类结果展示的所有功能模块,提供灵活的配置策略和扩展接口。该平台开发的目的是为网络流量分类领域的研究人员提供对比的基准并促进新的分类技术的分享,为该领域的发展提供支持与帮助。
[Abstract]:The existing network traffic classification techniques include port-based, load-based, traffic statistical features, behavior-based and flow-based traffic propagation diagrams. Most of the new applications use dynamic ports, resulting in a classification accuracy of less than 50. Because of its high time and space complexity, the load-based classification method is not suitable for high-speed link classification, nor can it identify encrypted traffic. The classification method based on traffic statistics and machine learning has poor robustness in real-time network traffic classification. Behavior-based and traffic propagation graph based classification methods are not suitable for real-time traffic classification. Therefore, it is necessary to study new network traffic classification methods, especially the mixed methods of various classification techniques, to meet the requirements of fast, accurate and diversified traffic classification in the current network environment. The classification method based on regular expression needs sequential load, and the classification method based on flow statistics and machine learning requires sequential network flow feature. However, for TCP data flow, existing TCP data stream recombination methods can not deal with SYN packet loss and packet loss. Therefore, this paper first proposes a TCP data stream reorganization method based on sliding window, which focuses on solving the recombination in the case of packet loss, which greatly improves the efficiency of recombination. The use of port-based and load-based classification methods alone can not meet the requirements of fast and accurate classification. Therefore, this paper combines the speediness of port-based classification and the accuracy of load-based classification. A classification method based on one-way supervision and probability attenuation is proposed, which realizes fast and accurate classification under real-time traffic. On the basis of this method, a high performance hierarchical network traffic classification framework is proposed, which combines many classification techniques, feedback the classification results and guide each other among different classification modules. Application of diverse classification requirements. On the basis of this framework, this paper studies and develops an open source network traffic classification and comparison benchmark platform, OpenNTCBB, which includes all the functional modules from the pre-processing of network data to the display of post-classification results. Provides flexible configuration policies and extended interfaces. The purpose of this platform is to provide comparative benchmarks for researchers in the field of network traffic classification and to promote the sharing of new classification techniques, and to provide support and help for the development of this field.
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.06
【相似文献】
中国期刊全文数据库 前10条
1 王若愚;方芳;叶昭;;流量分类技术精细管理网络[J];中国教育网络;2012年02期
2 马明成;莫晓俊;姜洪臣;徐波;;音频分类技术在广播质量评估中的应用[J];广播与电视技术;2010年10期
3 黄树成;曲亚辉;;数据流分类技术研究综述[J];计算机应用研究;2009年10期
4 张俊,石功军,王中平;信息处理过程中的分类技术[J];声学技术;2003年04期
5 张李,涂晓东,何诚;流分类技术的研究[J];电子科技大学学报;2004年06期
6 李洋;赵骅;;基于信息熵和决策分类技术的邮件识别研究[J];计算机科学;2008年02期
7 夏雪;肖德宝;顾婷;;基于本体的报警分类技术在报警评估过程中的应用与实现(英文)[J];北京交通大学学报;2008年06期
8 黄敏;何中市;;分类技术在高职教学质量评价分析中的应用[J];计算机工程与设计;2012年03期
9 王与;刘洋;;分类技术在高校教学管理中的应用[J];滁州学院学报;2011年05期
10 段巍巍;许海滨;;基于分类技术的目标客户辅助定位方法研究[J];江苏通信;2008年03期
中国重要会议论文全文数据库 前1条
1 梁晓雯;闵友钢;;音乐情感分类技术在媒体资产管理中的应用[A];中国新闻技术工作者联合会2008年学术年会论文集(下)[C];2008年
中国博士学位论文全文数据库 前1条
1 毕夏安;高性能包分类技术及其应用研究[D];湖南大学;2012年
中国硕士学位论文全文数据库 前10条
1 周方;社交网络节点分类技术研究[D];辽宁大学;2015年
2 李林林;面向不均衡数据的半监督网络流量分类技术研究与实现[D];解放军信息工程大学;2014年
3 董辉;基于混合方法的网络流量分类技术研究[D];哈尔滨理工大学;2014年
4 丛蓉;基于采样的网络流量分类技术研究[D];北京邮电大学;2012年
5 朱秋香;流分类技术研究及其原型系统的实现[D];东南大学;2004年
6 张海笑;数据挖掘分类技术在高校教学中的应用研究[D];广东工业大学;2005年
7 常慧;分类技术在税收管理中的应用[D];郑州大学;2003年
8 蒋杰;基于分类技术的电子支付平台作弊账户的识别模型研究[D];浙江工业大学;2012年
9 陈铮;基于音乐流派分类技术的音乐库分类检索系统的研究与实现[D];华东师范大学;2012年
10 代丽;DFI流量分类技术的研究和实现[D];北京邮电大学;2011年
,本文编号:1901176
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1901176.html