当前位置:主页 > 管理论文 > 移动网络论文 >

因特网流量类不平衡特性与分类方法的研究

发布时间:2021-11-18 21:13
  因特网(Internet)流量分类是实施网络管理、服务质量保障、网络计费以及网络安全等的重要基础。传统的流量分类方法难以适应因特网应用的快速发展,基于机器学习的流量分类方法具有良好的应用前景。但是,这类方法通常以获得高总体分类准确率为优化目标,尚未顾及因特网流量数据所具有的多类不平衡特性,致使分类性能往往偏向大类,而忽略小类。在因特网流量中,某些小类应用多涉及命令流、实时通信流等,其分类性能关乎通信的可靠性或用户体验,有的小类属于重量级应用,其分类性能关乎网络规划或带宽资源分配等。目前,因特网流量的类不平衡特性及分类方法缺乏系统研究。论文针对因特网流量数据集,就选定的特征空间,观察分析网络流样本的类分布特性,分析其特点,从数据重采样、特征选择和分类算法三个方面展开因特网流量分类方法的研究。论文的主要贡献如下:(1)因特网流量数据的类不平衡特性。论文从表象和内在两个方面剖析流量数据存在的类不平衡特性。比较各类别的网络流数目和字节数目,发现流量数据往往包括多个大类和多个小类,大类与小类之间的流数目差距显著,小类可能拥有较大比例的字节数,类内还可能存在大流与小流之间的显著不平衡。观察分析网络... 

【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:134 页

【学位级别】:博士

【文章目录】:
摘要
Abstract
目录
表目录
图目录
缩略语对照表
术语说明
第一章 绪论
    1.1. 研究背景
    1.2. 面临的挑战
    1.3. 研究目的与意义
    1.4. 研究内容
    1.5. 论文结构
第二章 因特网流量分类与类不平衡研究现状
    2.1. 因特网流量分类研究现状
        2.1.1 基于规则匹配的流量分类方法
        2.1.2 基于机器学习的流量分类方法
        2.1.3 类不平衡问题
    2.2. 类不平衡研究现状
        2.2.1 类不平衡相关因素分析
        2.2.2 数据重采样方法
        2.2.3 特征选择方法
        2.2.4 分类算法
    2.3. 因特网流量分类性能评估指标
    2.4. 共享的因特网流量数据集
    2.5. 本章小结
第三章 因特网流量数据的类不平衡特性
    3.1. 因特网流量数据的表象不平衡特性
        3.1.1 流不平衡特性
        3.1.2 字节不平衡特性
    3.2. 因特网流量数据的内在不平衡特性
        3.2.1 网络流特性
        3.2.2 网络流样本在特征空间的分布
    3.3. 类不平衡解决方案的探讨
        3.3.1 重采样与代价敏感学习方法
        3.3.2 因特网流量分类性能
        3.3.3 类不平衡特性与流量分类性能的关系
    3.4. 适合因特网流量多小类特性的代价敏感学习算法
        3.4.1 错分代价矩阵分析
        3.4.2 加权错分代价矩阵
        3.4.3 实验验证
    3.5. 本章小结
第四章 因特网流量数据的重采样方法
    4.1. 重采样方法 PSC
        4.1.1 基于 k-均值的流量数据划分
        4.1.2 SMOTE 过采样算法
        4.1.3 启发式欠采样算法
    4.2. PSC 方法的理论分析
        4.2.1 基于误差平方和的类内散度分析
        4.2.2 基于 N2 的数据复杂度分析
    4.3. 实验结果与分析
        4.3.1 实验设计与参数设置
        4.3.2 PSC 的流量分类性能
        4.3.3 多种重采样方法比较
    4.4. 本章小结
第五章 因特网流量统计特征的选择算法
    5.1. 过滤式特征选择算法
        5.1.1 评估模型
        5.1.2 搜索模型
    5.2. 特征选择算法 BFS
        5.2.1 基于信息熵的局部评估模型
        5.2.2 基于对称不确定性的全局评估模型
        5.2.3 搜索模型
        5.2.4 BFS 算法流程
    5.3. 实验结果与分析
        5.3.1 实验设计与参数设置
        5.3.2 特征选择结果
        5.3.3 因特网流量总体分类性能
        5.3.4 小类分类性能
        5.3.5 特征选择算法的运行时间
        5.3.6 因特网流量分类稳定性与实际应用讨论
    5.4. 本章小结
第六章 因特网重型流分类方法
    6.1. 重型流分布特点与分类问题
        6.1.1 报文/字节累计分布
        6.1.2 重型流分类问题
    6.2. 重型流分类方法
        6.2.1 基于信息增益率的流尺度模块化方法
        6.2.2 集成学习方法
    6.3. 实验结果与分析
        6.3.1 实验设计与参数设置
        6.3.2 流尺度模块化方法的流量分类性能
        6.3.3 集成学习的流量分类性能
        6.3.4 重型流分类方法的子流分类性能
        6.3.5 重型流分类方法横向比较
        6.3.6 主要参数讨论
    6.4. 本章小结
总结与展望
    工作总结
    研究展望
参考文献
攻读博士学位期间取得的研究成果
致谢
答辩委员会对论文的评定意见


【参考文献】:
期刊论文
[1]分类不平衡协议流的机器学习算法评估与比较[J]. 张宏莉,鲁刚.  软件学报. 2012(06)
[2]基于机器学习的IP流量分类研究[J]. 刘琼,刘珍,黄敏.  计算机科学. 2010(12)
[3]基于C4.5决策树的流量分类方法[J]. 徐鹏,林森.  软件学报. 2009(10)
[4]基于支持向量机的Internet流量分类研究[J]. 徐鹏,刘琼,林森.  计算机研究与发展. 2009(03)
[5]基于流统计特性的网络流量分类算法[J]. 林平,余循宜,刘芳,雷振明.  北京邮电大学学报. 2008(02)
[6]Peer-to-Peer文件共享系统的测量研究[J]. 刘琼,徐鹏,杨海涛,彭芸.  软件学报. 2006(10)

博士论文
[1]IP网络业务识别关键技术研究[D]. 王攀.南京邮电大学 2013
[2]互联网流量识别技术研究[D]. 田旭.北京邮电大学 2012
[3]网络流量的离线分析[D]. 林平.北京邮电大学 2010



本文编号:3503619

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3503619.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dfdba***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com