基于云计算的取证数据集聚类方法的分析与实现
发布时间:2017-11-08 22:17
本文关键词:基于云计算的取证数据集聚类方法的分析与实现
【摘要】:当今互联网技术飞速发展,网络带宽达到一个新的高度。在高速的网络环境下人们使用网络已经越来越方便。但是,网络安全的问题总是伴随着人们的方便使用而来。在海量数据的面前如何精准并且高效的获得网络犯罪的痕迹是取证领域的研究热点之一。显然,传统的取证技术在数据量急剧增加的新时代的环境下已经无法满足相应的要求。 云计算对于取证领域来说既是机遇又是挑战。一方面近几年提出的云计算技术为庞大的数据量问题提供了一个很好的解决思路。另一方面云环境的本身发展还不成熟,因此其本身还有很多安全问题。云取证是对于两个领域的融合和吸收。本文主要总结了云计算技术,介绍了其特点和关键技术。针对目前的云计算平台的结构与环境指出其面临的威胁。探讨了云取证这一新兴的领域,结合云计算和取证的研究状况概括其中的关键技术。给出了新环境下取证的4个基本流程。 本文针对的是DDoS攻击产生的网络流量数据集的聚类分析工作,在文章前几部分概述了分布式拒绝服务攻原理,分类,实验工具以及相关的检测方法。概括数据挖掘算法基本理论,说明了聚类分析的流程和几种常见方法。K-Means算法作为一种数据挖掘中常用的聚类算法,在大数据集处理上具有较好的可伸缩、高效性和良好的扩张性,但是它存在对聚类先验知识有要求的缺点。因此本文给出了一个分布式的优化K-means聚类算法来解决海量数据的证据挖掘工作。最后借助于比较流行的云平台Hadoop实现了一个基于云计算技术的网络流量取证分析的模拟实验系统。利用了相对经典的KDD CUP99数据集验证了其有效性和可行性。 本文的实验平台使用的算法是K-means,对于K-means算法的输入数据进行了粗聚类的预处理,结果得到了很大改善。但是粗聚类中相关参数的设定问题依然没有好的解决方法。此外本文提出的实验还需要更大规模的数据集和真实情况下的大规模集群来验证。另一方面,云取证是一个两个学科交叉的学科。整个过程最不可忽视的部分是法律因素。如何保证这些数据在司法机关人员面前的可用性和可信性,还需要专家学者的不断努力。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.08;TP311.13
【参考文献】
中国期刊全文数据库 前8条
1 陈波,于泠;DoS攻击原理与对策的进一步研究[J];计算机工程与应用;2001年10期
2 张纹华;贾智平;李新;;利用蚁群聚类检测应用层DDoS攻击的方法[J];计算机工程与应用;2011年14期
3 武鲁;王连海;顾卫东;;基于云的计算机取证系统研究[J];计算机科学;2012年05期
4 杨长春;倪彤光;薛恒新;;一种基于数据挖掘的DDoS攻击入侵检测系统[J];计算机工程;2007年23期
5 高能;冯登国;向继;;一种基于数据挖掘的拒绝服务攻击检测技术[J];计算机学报;2006年06期
6 张亚玲;韩照国;任姣霞;;基于相对熵理论的多测度网络异常检测方法[J];计算机应用;2010年07期
7 谢柏林;蒋盛益;张倩生;;基于请求关键词的应用层DDoS攻击检测方法[J];计算机科学;2013年07期
8 刘运;蔡志平;钟平;殷建平;程杰仁;;基于条件随机场的DDoS攻击检测方法[J];软件学报;2011年08期
,本文编号:1159086
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1159086.html