基于机器学习的网络流量识别技术研究
本文关键词:基于机器学习的网络流量识别技术研究,由笔耕文化传播整理发布。
【摘要】:当今网络规模不断扩大,网络流量爆发式增长,网络威胁也同步增长。识别网络流量在一定程度上可以解决问题。网络流量识别可以区分正常流量和威胁,以此防御攻击。然而,网络流量识别不仅要分析海量数据,还要在不影响网络性能的前提下实现实时监控,对运算时间和运算空间的要求很高。如何在海量网络流量中快速准确地识别出不良行为是本论文主要研究的问题。面对日益复杂的互联网态势,本论文从机器学习方法入手,尝试进行网络流量识别,在网络流量特征提取时的特征选择上和为使识别算法更快更准确的参数选择上做了相关研究。本论文的主要研究有:基于共识决策的特征选择算法:本论文针对在网络流量识别中表示流量的特征过多易导致系统分类效率降低,泛化能力下降的问题,结合已有的特征选择算法,提出一种基于共识决策法的特征选择算法。该算法不仅提供了比较完善的特征集,还研究了不同数量的特征对分类结果的影响,以满足根据实际情况而选择不同特征数量的需求。仿真结果表明,特征选择提高了系统的检测效率,降低了运算复杂性。基于改进人工蜂群算法的参数寻优方法,并将之应用于支持向量机的参数寻优:支持向量机算法是对样本数据进行预测和分类问题的一种有效方法,在网络行为分类领域得到广泛应用。算法参数(主要是惩罚因子C和核函数参数g)对分类准确率影响很大。人工蜂群算法是近年来参数寻优领域新出现的一种全局随机搜索方法,具有计算简单、参数设置少的优点。对于标准人工蜂群算法用于支持向量机的参数寻优容易达成局部最优解,难以靠近全局最优,最终的收敛精度较低,计算时间较长的问题,本论文在原有搜索策略的基础上进行了修改,提出一种表现更好的人工蜂群算法。该算法在雇佣蜂与跟随蜂更新蜜源时,采用基于当前最优解的局部搜索策略,以提高蜜蜂的局部搜索能力,加快收敛速度并获得更高的精度;引入混沌序列使产生的蜜源分布更均匀,防止陷入局部最优。仿真结果表明,改进的人工蜂群算法在搜索速度和精度上均优于同类算法。最后本论文在Mathlab环境下结合上述改进在KDDCUP99入侵检测数据集上进行了识别实验。实验结果显示,该方法在保障准确性的前提下能够获得更高的识别效率。
【关键词】:机器学习 网络流量识别 共识决策 特征选择 人工蜂群
【学位授予单位】:江南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP181;TP393.06
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-13
- 1.1 课题背景及研究意义8-9
- 1.2 国内外的研究现状9-11
- 1.2.1 网络流量识别研究现状9-10
- 1.2.2 发展趋势和面临问题10-11
- 1.3 本文主要研究内容11
- 1.4 本文组织结构11-13
- 第二章 网络流量识别技术13-20
- 2.1 网络流量识别简介13-14
- 2.2 特征选择算法14-16
- 2.3 SVM分类识别算法16-19
- 2.4 本章小结19-20
- 第三章 基于共识决策的特征选择算法20-32
- 3.1 共识决策算法的原理和流程20-23
- 3.1.1 共识决策的原理20-21
- 3.1.2 共识决策的流程21-23
- 3.2 实验数据集23-26
- 3.2.1 实验数据KDDCUP99 数据集23-24
- 3.2.2 特征及选取24-26
- 3.3 基于共识决策的特征选择实验和结果分析26-31
- 3.3.1 数据预处理26-28
- 3.3.2 基于共识决策特征提取的流程及对比实验设计28
- 3.3.3 几种原始特征选择算法的比较28-29
- 3.3.4 原始特征选择算法与共识决策特征提取的比较29-30
- 3.3.5 特征的数量对识别结果的影响30-31
- 3.4 本章小结31-32
- 第四章 基于改进人工蜂群参数寻优的网络流量分类32-44
- 4.1 人工蜂群参数寻优的原理和改进33-38
- 4.1.1 人工蜂群来源33
- 4.1.2 人工蜂群算法基本原理33-36
- 4.1.3 基于当前最优解和混沌序列的改进人工蜂群36-37
- 4.1.4 算法流程37-38
- 4.2 改进人工蜂群的实验38-42
- 4.2.1 实验测试函数和对比算法38
- 4.2.2 实验结果和分析38-41
- 4.2.3 算法的时间复杂度分析41-42
- 4.3 改进人工蜂群优化SVM参数的网络流量分类42
- 4.4 本章小结42-44
- 第五章 基于机器学习的网络流量识别实验44-48
- 5.1 实验环境44
- 5.2 实验流程44-46
- 5.3 特征选择和参数寻优共同优化的网络流量识别实验结果与分析46-47
- 5.4 本章小结47-48
- 主要结论与展望48-49
- 致谢49-50
- 参考文献50-53
- 附录:作者在攻读硕士学位之间发表的论文53
【参考文献】
中国期刊全文数据库 前10条
1 于明;艾月乔;;基于人工蜂群算法的支持向量机参数优化及应用[J];光电子.激光;2012年02期
2 陈武;梁刚;杨进;;一种改进的SVM算法在入侵检测中的应用[J];计算机安全;2013年06期
3 张玉欣;程志峰;徐正平;白晶;;参数寻优支持向量机在基于光声光谱法的变压器故障诊断中的应用[J];光谱学与光谱分析;2015年01期
4 田俊峰;黄红艳;常新峰;;特征选择的轻量级入侵检测系统[J];计算机工程与应用;2009年04期
5 王庆林;;支持共识决策过程的群排序集结[J];计算机工程与应用;2011年29期
6 银建霞;孟红云;;具有混沌差分进化搜索的人工蜂群算法[J];计算机工程与应用;2011年29期
7 陈亮;龚俭;徐选;;应用层协议识别算法综述[J];计算机科学;2007年07期
8 张莉,孙钢,郭军;入侵检测系统中有监督学习的特征选择方法[J];计算机工程;2005年13期
9 高宏宾;彭商濂;焦东升;;基于块和分解的改进的支持向量机算法[J];计算技术与自动化;2005年04期
10 熊才权;李德华;;综合集成研讨厅共识达成模型及其实现[J];计算机集成制造系统;2008年10期
中国重要会议论文全文数据库 前2条
1 赵晶;高隽;张旭东;谢昭;;支持向量机综述[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
2 苏毅;吴文虎;郑方;方棣棠;;基于支持向量机的语音识别研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国博士学位论文全文数据库 前3条
1 林冠洲;网络流量识别关键技术研究[D];北京邮电大学;2011年
2 王艳娇;人工蜂群算法的研究与应用[D];哈尔滨工程大学;2013年
3 张冬丽;人工蜂群算法的改进及相关应用研究[D];燕山大学;2014年
中国硕士学位论文全文数据库 前7条
1 杨飞虎;特征选择算法及其在网络流量识别中的应用研究[D];南京邮电大学;2012年
2 梁燕;SVM分类器的扩展及其应用研究[D];湖南大学;2008年
3 张伟;群体决策支持系统中的群体偏好集结技术研究[D];武汉理工大学;2009年
4 李红英;支持向量分类机的核函数研究[D];重庆大学;2009年
5 林立友;基于协议分析和SVM多分类的入侵检测系统研究[D];内蒙古科技大学;2011年
6 张菲;蜂群混合算法[D];西安电子科技大学;2013年
7 杨丹;人工蜂群算法的改进及应用研究[D];安徽大学;2014年
本文关键词:基于机器学习的网络流量识别技术研究,,由笔耕文化传播整理发布。
本文编号:357814
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/357814.html