基于机器学习的网络流量分类算法研究
本文关键词:基于机器学习的网络流量分类算法研究
更多相关文章: 机器学习 C4.5决策树 朴素贝叶斯 支持向量机 特征选择
【摘要】:本学位论文来自于“电力信息通信网络智能管道多维感知技术研究及应用”项目,研究目标为面向业务的流量识别与感知,主要内容为基于机器学习的网络流量识别算法研究。论文首先介绍了目前运用在网络流量分类领域的四大类分类方法:基于端口映射、基于有效负载、基于主机行为以及基于机器学习的流量分类方法。通过比较四类分类方法的特点,得出了基于机器学习的流量分类方法是目前最适合应用在电力通信网环境中的流量分类方法。之后本文着重研究了三种典型的机器学习分类算法:C4.5决策树算法,朴素贝叶斯分类器和支持向量机。针对每种算法,本文通过分析实验数据得出了他们在摩尔数据集中的分类性能,比较了不同的特征选择方法对分类结果的影响,并针对支持向量机研究了g参数和C参数对于分类性能的影响。最后,本文提出基于CIG和CGR的特征选择方法,并在三种机器学习算法中应用分析其性能,比较它们与已有特征选择方法的性能差异。结果表明,本文中提出的CIG特征选择方法在每种分类算法中都能获得较好的性能。全文共分为五章,各章节的主要内容为:第一章为绪论,简单介绍了课题背景及研究目的,同时给出了论文的章节安排。第二章概述了目前四大类流量分类方法,通过分析其各自特点以及结合电力信息通信网对流量分类技术的要求,得出结论:基于机器学习的特征分类方法最适合应用在电力信息通信网环境中。之后对特征选择技术以及特征选择在流量分类技术中的应用进行了介绍。第三章着重研究了三种常用的机器学习算法:C4.5决策树算法,朴素贝叶斯分类器以及支持向量机。通过实验分析了每种算法在摩尔数据集上的分类性能表现,比较并分析出了与每种算法相适应的特征选择方法和特征子集大小选择,并针对支持向量机研究了参数的选择对分类性能的影响。第四章提出了基于CIG和CGR的特征选择方法,并在三种机器学习算法中应用这两种特征选择方法,分析其性能。最后一章归纳本学位论文的研究工作,指出未来进一步研究的方向。
【关键词】:机器学习 C4.5决策树 朴素贝叶斯 支持向量机 特征选择
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.06;TP181
【目录】:
- 摘要4-5
- ABSTRACT5-8
- 第一章 绪论8-12
- 1.1 课题背景和研究目的8
- 1.2 流量分类方法概述8-10
- 1.2.1 流量分类基本概念8-9
- 1.2.2 流量分类技术的发展现状9-10
- 1.2.3 四种流量分类方法的比较10
- 1.3 论文章节安排10-12
- 第二章 基于机器学习的流量分类方法和特征选择技术12-16
- 2.1 流量分类方法的选择12
- 2.1.1 电力信息通信网对流量分类技术的需求12
- 2.1.2 流量分类方法的选择12
- 2.2 基于机器学习的流量分类方法12-14
- 2.2.1 无监督机器学习方法12-13
- 2.2.2 有监督机器学习方法13-14
- 2.3 特征选择14-15
- 2.3.1 特征选择的定义14-15
- 2.3.2 特征选择在机器学习分类算法中的应用15
- 2.4 本章小结15-16
- 第三章 机器学习算法的分类性能以及特征选择方法的选择16-46
- 3.1 C4.5决策树算法16-25
- 3.1.1 C4.5决策树算法原理16-17
- 3.1.2 C4.5算法分类性能17-18
- 3.1.3 与C4.5算法相适应的特征选择方法18-25
- 3.2 朴素贝叶斯分类器25-33
- 3.2.1 朴素贝叶斯分类器原理25
- 3.2.2 NBC算法的分类性能25-26
- 3.2.3 与NBC算法相适应的特征选择方法26-33
- 3.3 支持向量机33-45
- 3.3.1 支持向量机原理33-34
- 3.3.2 与SVM相适应的特征选择方法34-42
- 3.3.3 g参数和C参数对SVM算法分类性能的影响42-45
- 3.4 本章小结45-46
- 第四章 基于CIG和CGR的特征选择方法46-57
- 4.1 CIG与CGR特征选择的原理46
- 4.2 CIG特征选择方法在机器学习分类算法中的性能46-51
- 4.2.1 CIG在C4.5决策树算法中的性能46-48
- 4.2.2 CIG在NBC算法中的性能48-49
- 4.2.3 CIG在SVM算法中的性能49-51
- 4.3 CGR特征选择方法在机器学习分类算法中的性能51-55
- 4.3.1 CGR在C4.5算法中的性能51-52
- 4.3.2 CGR在NBC算法中的性能52-53
- 4.3.3 CGR在SVM算法中的性能53-55
- 4.4 CIG与CGR性能比较55
- 4.5 本章小结55-57
- 第五章 总结与展望57-58
- 5.1 研究工作的总结57
- 5.2 未来工作的展望57-58
- 致谢58-59
- 参考文献59-61
- 攻读硕士学位期间的研究成果61
【相似文献】
中国期刊全文数据库 前10条
1 张明玉,倪志伟;基于机器学习的智能决策支持系统[J];淮南师范学院学报;2005年03期
2 杨凌霄;武建平;;机器学习方法在人脸检测中的应用[J];计算机与数字工程;2008年03期
3 ;第十一届中国机器学习会议[J];智能系统学报;2008年02期
4 ;第14届中国机器学习会议[J];智能系统学报;2012年06期
5 费宗铭;吕建;王志坚;陈道蓄;徐家福;;机器学习[J];计算机科学;1991年01期
6 赵沁平;魏华;王军玲;;机器学习技术与机器学习系统[J];计算机科学;1993年05期
7 姚敏;机器学习及其发展方向[J];计算机时代;1994年04期
8 ;第31届机器学习国际会议(英文)[J];智能系统学报;2014年01期
9 黄海滨;机器学习及其主要策略[J];河池师范高等专科学校学报(自然科学版);2000年04期
10 佘玉梅;一种协调机器学习方法研究[J];云南民族学院学报(自然科学版);2000年03期
中国重要会议论文全文数据库 前10条
1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年
2 王昊;李银波;纪志梁;;利用机器学习方法预测严重药物不良反应-呼吸困难[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年
3 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
4 周晴杰;徐立鸿;吴启迪;;机器学习串级结构的初步探讨[A];1998年中国控制会议论文集[C];1998年
5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
7 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 黄金铁;李景银;周建常;;对高炉炉况评价模型参数的机器学习——一个三类线性模式分类器的实现[A];1995中国控制与决策学术年会论文集[C];1995年
9 程国建;蔡磊;潘华贤;;核向量机在大规模机器学习中的应用[A];第十一届中国青年信息与管理学者大会论文集[C];2009年
10 张钹;张铃;;统计学习理论及其应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年
中国重要报纸全文数据库 前10条
1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
2 IBM大数据专家 James Kobielus 范范 编译;机器学习已成为大数据基石[N];网络世界;2014年
3 本报记者 房琳琳;合久必分:分布式“机器学习”应运而生[N];科技日报;2014年
4 雨辰;机器学习类图书为什么火爆[N];中华读书报;2014年
5 百度公司技术副总监 多媒体部负责人 余凯;深度学习与多媒体搜索技术演进[N];中国信息化周报;2013年
6 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
7 本报记者 张晔邋通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
8 记者 彭德倩;机器学习精度提升近6个百分点[N];解放日报;2006年
9 本报记者 闵杰;大数据热 高端人才缺[N];中国电子报;2013年
10 沈建苗 编译;如何成为大数据科学家[N];计算机世界;2013年
中国博士学位论文全文数据库 前10条
1 董春茹;机器学习中的权重学习与差分演化[D];华南理工大学;2015年
2 姚明臣;机器学习和神经网络学习中的若干问题研究[D];大连理工大学;2016年
3 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
4 胡巍;面向格结构的机器学习[D];上海交通大学;2009年
5 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年
6 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年
7 梁锡军;稀疏优化在机器学习中的若干应用[D];大连理工大学;2013年
8 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年
9 陈慧灵;面向智能决策问题的机器学习方法研究[D];吉林大学;2012年
10 周伟达;核机器学习方法研究[D];西安电子科技大学;2003年
中国硕士学位论文全文数据库 前10条
1 张柯;基于机器学习的错误定位方法研究[D];南京航空航天大学;2015年
2 于雯;机器学习在信用评级中的应用[D];中国海洋大学;2015年
3 裴松年;基于机器学习的分类算法研究[D];中北大学;2016年
4 李红;基于机器学习的中医药配方评估研究[D];南京大学;2016年
5 周文U,
本文编号:1025866
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1025866.html