当前位置:主页 > 管理论文 > 移动网络论文 >

基于监督学习的类不均衡网络流量分类算法研究

发布时间:2024-05-21 03:07
  随着互联网的飞速发展,网络流量分类技术在网络管理和网络安全领域的重要性日益凸显。基于机器学习的网络流量分类方法具有分类精度高、可扩展性强等特点,得到了广大研究人员的青睐,但流量样本分布不均衡、分类模型更新不及时等问题依然突出。本文对基于监督学习的网络流量分类方法进行了分析与研究,主要研究内容如下:1.针对网络流量样本分布不均衡导致分类器的性能被大类别淹没,忽略小类别的分类精度的问题,提出一种基于相关性过滤的网络流量特征选择算法。首先,根据类别分布信息,定义偏向于小类别的特征度量——加权对称不确定性;计算特征与类别间的加权对称不确定性,通过与阈值进行比较,删除不相关特征。接着,基于加权对称不确定性重新对马尔科夫毯条件进行定义,得到近似马尔科夫毯条件,利用近似马尔科夫毯删除冗余特征。最后,采用基于相关性的特征度量和序列搜索算法进一步降低特征维数,得到最优特征子集。实验结果表明,所提特征选择算法能有效应对类别分布不均衡问题,可以在不牺牲分类器整体精确率的情况下,有效提高小类别的识别率。2.针对网络流量分类过程中,模型的分类精度随着时间的推移逐渐降低以及模型难以实现频繁、及时更新的问题,提出一...

【文章页数】:75 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
注释表
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 基于端口号的网络流量分类
        1.2.2 基于特征字段的网络流量分类
        1.2.3 基于传输层主机行为的网络流量分类
        1.2.4 基于机器学习的网络流量分类
    1.3 主要研究内容
    1.4 论文组织架构
第2章 网络流量分类基本概念及相关技术
    2.1 网络流量分类
    2.2 常用的监督学习算法
        2.2.1 朴素贝叶斯
        2.2.2 逻辑斯蒂回归
        2.2.3 K近邻
        2.2.4 决策树
        2.2.5 支持向量机
    2.3 基于监督学习的网络流量分类技术
        2.3.1 特征选择
        2.3.2 常用性能评价指标
    2.4 本章小结
第3章 基于相关性过滤的网络流量特征选择算法
    3.1 引言
    3.2 算法描述
        3.2.1 加权对称不确定性
        3.2.2 近似马尔科夫毯
        3.2.3 相关性度量
    3.3 算法设计与分析
    3.4 实验仿真
        3.4.1 数据集
        3.4.2 关键参数设置
        3.4.3 实验结果与分析
    3.5 本章小结
第4章 基于集成学习的类不均衡网络流量分类模型
    4.1 引言
    4.2 算法描述
        4.2.1 增量学习
        4.2.2 早期概念漂移检测
        4.2.3 基分类器集成
    4.3 算法设计与分析
    4.4 实验仿真
        4.4.1 数据集
        4.4.2 评价指标
        4.4.3 关键参数设置及基分类器的选择
        4.4.4 实验结果与分析
    4.5 本章小结
第5章 总结与展望
    5.1 研究工作总结
    5.2 未来工作展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果



本文编号:3979519

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3979519.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47808***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com