基于半监督学习的分布式在线流量识别研究
发布时间:2023-02-28 19:53
随着互联网技术的不断发展,网络规模逐渐增大并涌现出各种新的网络应用(如P2P、IPTV等)。这些新型流量的急速增长一方面造成严重的带宽负担,加剧网络的拥塞状况;另一方面恶意流量也频繁出现在互联网上,不仅加快带宽的消耗而且对网络安全也提出很大的挑战。网络应用的增加,导致网络速率不断增长,网络节点处的网络管理设备面临越来越大的压力。如何通过有效的技术手段实时识别和监测流量,从而管理和控制各种恶意流量,提供合理的带宽资源和服务,成为当前网络管理面临的重要难题之一。 网络流量分类正是解决上述难题的基础,尤其是基于半监督学习的分类方法,不仅能够利用少量标签数据促进分类系统的性能,而且具有发现新的模式的功能成为当前流量分类领域研究的热点。鉴于网络流量本身天然的地域性、时域性,本文将分布式的理念和技术引入在线流量分类中,将分类任务分散到不同的节点上,由中心节点管理并协调各个子节点分类并提供对子节点分类结果的验证。 首先,本文针对大多数基于有监督机器学习的分类器过度依赖于有标签数据问题,提出了基于k均值算法的半监督聚类算法Semi-kmeans进行流量分类的研究。该算法使用具有准确应用类型的流量样本作...
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 论文的研究对象和内容
1.2 论文的研究背景和意义
1.3 论文的主要工作及创新点
1.3.1 基于半监督学习的流量分类方法
1.3.2 在线流量分类模型研究
1.3.3 分布式在线分类方法研究
1.4 论文的组织结构
第二章 网络流量识别技术的研究现状
2.1 基于端口的分类方法
2.1.1 基于端口分类方法的介绍
2.1.2 基于端口分类方法的原理
2.1.3 基于端口分类方法的分析
2.2 基于应用层负载特征的分类方法
2.2.1 应用层负载特征的分类技术简介
2.2.2 DPI 技术原理
2.2.3 DPI 技术分析
2.3 机器学习分类方法
2.3.1 机器学习方法简介
2.3.2 机器学习原理
2.3.3 基于机器学习的流量分类方法的分析
2.3.3.1 基于有监督学习的分类方法
2.3.3.2 基于无监督学习的分类方法
2.3.3.3 基于半监督学习的分类方法
2.4 在线网络流量分类方法
2.4.1 集中式在线流量分类方法
2.4.2 分布式在线流量分类方法
2.5 本章小结
第三章 半监督聚类方法的研究
3.1 k-means 聚类算法介绍
3.2 半监督算法 Semi-kmeans
3.2.1 Semi-kmeans 思想
3.2.2 Semi-kmeans 算法的新功能
3.3 实验与分析
3.3.1 实验数据
3.3.1.1 网络应用类型
3.3.1.2 具有真实网络应用类型样本的数据集
3.3.2 流量特征
3.3.3 评价方法
3.3.4 实验结果
3.3.4.1 算法比较
3.3.4.2 有标签样本的影响
3.3.4.3 对有监督分类结果的验证
3.3.4.4 发现新类的能力
3.3.4.5 识别速度的比较
3.4 本章小结
第四章 在线流量分类模型
4.1 C4.5 算法介绍
4.2 在线分类系统设计
4.2.1 部署具有准确应用类型标识的流量采集环境
4.2.2 流量转发
4.2.3 流量采集
4.2.4 基于有监督学习的在线流量分类模型
4.2.5 基于半监督学习的离线分类模型
4.2.6 分类结果验证
4.3 实验分析
4.3.1 基于有监督学习的在线分类
4.3.1.1 实验环境
4.3.1.2 在线分类过程分析
4.3.2 基于半监督学习验证在线分类结果
4.3.2.1 实验环境
4.3.2.2 实验结果分析
4.4 本章总结
第五章 分布式在线识别方法的研究
5.1 分布式在线识别方法
5.1.1 分布式概述
5.1.2 分布式在线识别方法
5.1.3 分布式在线流量识别模型的设计
5.2 分布式在线识别方法的仿真实验
5.2.1 仿真环境
5.2.2 仿真数据
5.2.3 仿真结果
5.3 本章小结
第六章 总结和展望
参考文献
致谢
附录
本文编号:3751738
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 论文的研究对象和内容
1.2 论文的研究背景和意义
1.3 论文的主要工作及创新点
1.3.1 基于半监督学习的流量分类方法
1.3.2 在线流量分类模型研究
1.3.3 分布式在线分类方法研究
1.4 论文的组织结构
第二章 网络流量识别技术的研究现状
2.1 基于端口的分类方法
2.1.1 基于端口分类方法的介绍
2.1.2 基于端口分类方法的原理
2.1.3 基于端口分类方法的分析
2.2 基于应用层负载特征的分类方法
2.2.1 应用层负载特征的分类技术简介
2.2.2 DPI 技术原理
2.2.3 DPI 技术分析
2.3 机器学习分类方法
2.3.1 机器学习方法简介
2.3.2 机器学习原理
2.3.3 基于机器学习的流量分类方法的分析
2.3.3.1 基于有监督学习的分类方法
2.3.3.2 基于无监督学习的分类方法
2.3.3.3 基于半监督学习的分类方法
2.4 在线网络流量分类方法
2.4.1 集中式在线流量分类方法
2.4.2 分布式在线流量分类方法
2.5 本章小结
第三章 半监督聚类方法的研究
3.1 k-means 聚类算法介绍
3.2 半监督算法 Semi-kmeans
3.2.1 Semi-kmeans 思想
3.2.2 Semi-kmeans 算法的新功能
3.3 实验与分析
3.3.1 实验数据
3.3.1.1 网络应用类型
3.3.1.2 具有真实网络应用类型样本的数据集
3.3.2 流量特征
3.3.3 评价方法
3.3.4 实验结果
3.3.4.1 算法比较
3.3.4.2 有标签样本的影响
3.3.4.3 对有监督分类结果的验证
3.3.4.4 发现新类的能力
3.3.4.5 识别速度的比较
3.4 本章小结
第四章 在线流量分类模型
4.1 C4.5 算法介绍
4.2 在线分类系统设计
4.2.1 部署具有准确应用类型标识的流量采集环境
4.2.2 流量转发
4.2.3 流量采集
4.2.4 基于有监督学习的在线流量分类模型
4.2.5 基于半监督学习的离线分类模型
4.2.6 分类结果验证
4.3 实验分析
4.3.1 基于有监督学习的在线分类
4.3.1.1 实验环境
4.3.1.2 在线分类过程分析
4.3.2 基于半监督学习验证在线分类结果
4.3.2.1 实验环境
4.3.2.2 实验结果分析
4.4 本章总结
第五章 分布式在线识别方法的研究
5.1 分布式在线识别方法
5.1.1 分布式概述
5.1.2 分布式在线识别方法
5.1.3 分布式在线流量识别模型的设计
5.2 分布式在线识别方法的仿真实验
5.2.1 仿真环境
5.2.2 仿真数据
5.2.3 仿真结果
5.3 本章小结
第六章 总结和展望
参考文献
致谢
附录
本文编号:3751738
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3751738.html