当前位置:主页 > 管理论文 > 移动网络论文 >

高性能网络流量采集和分析技术的实现

发布时间:2018-11-20 19:03
【摘要】:21世纪是信息技术的时代,随着网络技术的提高,信息技术的发展,计算机科学的进步,信息技术渗透到人们生活中的各处角落,为人们的工作,学习,生活带来了巨大的便利。近年来,互联网迅猛发展,网络带宽爆发式增大,高速网络发展为人们的生活带来了便利,促进了行业的发展,同时日益发展的高速网络也为软件系统的设计提出了难题。首先是高速网络数据流量采集的问题,为了对网络状态进行统计,需要对流量进行抓取分析,这项技术被广泛应用在网络监控,信息安全等方面,然而随着网络流量的爆发式增长,传统的数据包捕获方式的弊端开始显现出来,为了改善这种状况,国内外相关领域的学者进行 了不懈的努力。近年来,DPDK(Intel Data Plane Development Kit)高性能报文处理框架技术的发展使高速网络下的数据包捕获成为了可能。本文中将对DPDK技术进行简要介绍。在各项高性能数据分析技术中,哈希算法一直占有一席之地。传统哈希算法在存储方面已经表现出高性能的特点,然而在面对高速网络复杂多变的情况下,经典哈希算法的性能和健壮性有时会略显不足。本文将重点对高速率高并发网络下的哈希算法进行优化。本文会在三方面对已有的哈希算法进行优化,首先提出具有普适性的两种Cache算法,PBS-CPE和Cuckoo_Cache。这两种算法能够在不改变哈希算法均匀性的基础上提升查询_效率。继而针对布谷鸟哈希算法的插入性能进行优化,增加哈希函数的个数,设置溢出栈。最后针对分段哈希算法在高速网络环境下的性能表现提出了两种优化方法:最小下标值法和布鲁姆过滤器的迭代更新算法,根据这两种优化提出了具有skew特性的多段哈希算法,该算法在高速率高并发网络环境下相较于分段哈希算法来说具有更加优异的性能表现。在本论文中,设计了高速率高并发网络流管理系统,该系统利用DPDK技术对数据包进行采集,采用各种不同的哈希算法对数据包进行存储,在对数据包进行处理的同时生成该种哈希算法的性能数据,在统计结束后将该性能数据写入到本地日志中,以便后续的性能对比。同时,在本论文中,会对各项哈希算法及论文中提出的各项优化方面进行对比,通过实验数据可知,PBS-CPE和Cuckoo_Cache缓存算法能够提升哈希算法的查询效率。针对布谷鸟哈希算法的两种优化方法均能极大提高布谷鸟哈希表容量不高时其算法的插入性能和健壮性。布鲁姆过滤器的迭代更新法能够减小布鲁姆过滤器的假阳性率,因此在一定程度上能够提升查询性能。具有skew特性的多段哈希算法在高速网络的特定环境下相较于分段哈希算法来说具有更佳的查询性能。
[Abstract]:The 21st century is the era of information technology. With the improvement of network technology, the development of information technology and the progress of computer science, information technology permeates into every corner of people's life, and it can work and learn for people. Life brings great convenience. In recent years, with the rapid development of the Internet and the explosive increase of the network bandwidth, the development of high-speed network has brought convenience to people's life and promoted the development of the industry. At the same time, the increasingly developing high-speed network has also posed a difficult problem for the design of software system. First of all, the problem of high-speed network data flow collection. In order to statistics the network status, it is necessary to grasp and analyze the traffic. This technology has been widely used in network monitoring, information security, and so on. However, with the explosive growth of network traffic, the malpractice of traditional packet capture has begun to appear. In order to improve this situation, scholars at home and abroad have made unremitting efforts. In recent years, the development of, DPDK (Intel Data Plane Development Kit) high performance packet processing framework makes it possible to capture packets in high speed networks. In this paper, the DPDK technology will be briefly introduced. Among the high performance data analysis techniques, the hash algorithm has always occupied a place. The traditional hash algorithm has shown high performance in storage. However, in the face of complex and changeable high-speed network, the performance and robustness of the classical hash algorithm are sometimes slightly inadequate. This paper focuses on the optimization of hash algorithm in high speed and high speed concurrent networks. In this paper, we will optimize the existing hash algorithms in three aspects. First, we propose two universal Cache algorithms, PBS-CPE and Cuckoo_Cache.. These two algorithms can improve the query _ efficiency without changing the uniformity of the hash algorithm. Then the insertion performance of the cuckoo hashing algorithm is optimized to increase the number of hash functions and set the overflow stack. Finally, two optimization methods are proposed for the performance of piecewise hash algorithm in high-speed network: minimum subscript method and iterative updating algorithm of Bloom filter. According to these two optimization methods, a multi-segment hash algorithm with skew characteristics is proposed. The performance of this algorithm is better than that of piecewise hash algorithm in high speed and high concurrency network environment. In this paper, a high speed and high concurrency network flow management system is designed. The system uses DPDK technology to collect data packets, and uses various hash algorithms to store data packets. The performance data of the hashing algorithm is generated at the same time when the packet is processed, and the performance data is written to the local log at the end of the statistics for the subsequent performance comparison. At the same time, in this paper, the hashing algorithms and the proposed optimization aspects are compared. Through the experimental data, we can see that PBS-CPE and Cuckoo_Cache cache algorithms can improve the query efficiency of the hash algorithm. The two optimization methods for the cuckoo hashing algorithm can greatly improve the insertion performance and robustness of the cuckoo hashing algorithm when the capacity of the cuckoo hash table is not high. The iterative updating method of the Bloom filter can reduce the false positive rate of the Bloom filter, so it can improve the query performance to some extent. Multi-segment hash algorithm with skew characteristics has better query performance than segmented hash algorithm in the specific environment of high-speed network.
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.0;TP274.2

【相似文献】

相关期刊论文 前10条

1 黄云轲;辛小龙;李成龙;李聿民;;关于对哈希算法的研究与应用[J];计算机光盘软件与应用;2012年03期

2 陈一骄;卢锡城;孙志刚;;面向流管理的哈希算法研究[J];计算机工程与科学;2008年04期

3 邹保平;;基于一致哈希算法的用电信息采集系统研究[J];电力信息化;2011年06期

4 刘华珠;贺前华;;基于哈希算法的网络桥接器地址维护方法(英文)[J];科学技术与工程;2008年17期

5 王远;;可重构哈希算法芯片的设计与实现[J];电脑知识与技术;2012年04期

6 张江,傅鹤岗;基于关联规则的二维哈希算法的改进[J];计算机工程与设计;2005年08期

7 唐铭;史长琼;周恺卿;张大方;;倒插入分段哈希算法[J];计算机应用;2011年02期

8 孙阳;朱宏峰;刘天华;;一种新型抗旋转攻击的鲁棒哈希算法[J];小型微型计算机系统;2011年04期

9 贺贤明,邵雷兵;一种基于学习的自适应哈希算法研究[J];计算机应用与软件;2004年11期

10 邵雷兵,庄毅;一种基于学习的自适应哈希算法研究[J];微电子学与计算机;2004年08期

相关会议论文 前3条

1 刘宗斌;马原;荆继武;夏鲁宁;;SM3哈希算法的硬件实现与研究[A];第26次全国计算机安全学术交流会论文集[C];2011年

2 文振q;朱为总;欧阳杰;高金花;;一种鲁棒可区分的视频感知哈希算法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年

3 文振q;高金花;刘朋飞;杜以华;张萌;;基于分块DCT和PCA的图像感知哈希算法研究[A];第十五届全国图象图形学学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 徐鲁 作家,,书评人;布鲁姆博士的快乐哲学[N];中国图书商报;2007年

2 钱文亮;布鲁姆的影响诗学与修正理论[N];中华读书报;2001年

3 乔纳森;称赏者布鲁姆[N];东方早报;2011年

4 王敖;布鲁姆的“最佳英语诗歌”[N];21世纪经济报道;2006年

5 贾晓伟;文学,不可遗忘的废黜之王[N];北京日报;2011年

6 张龙海;哈罗德·布鲁姆的文学观[N];文艺报;2011年

7 许知远;想起了艾伦·布鲁姆[N];经济观察报;2005年

8 山东社科院 战旭英;艾伦·布鲁姆:美国精神的没落[N];社会科学报;2007年

9 冯克利;以古典情怀针砭现代性困局[N];南方周末;2007年

10 本报记者 周帆 陈姗姗;特里·布鲁姆:全球化和多元化比专业化更重要[N];第一财经日报;2005年

相关博士学位论文 前8条

1 金仲明;基于哈希算法的海量多媒体数据检索研究[D];浙江大学;2015年

2 焦玉华;音频感知哈希算法研究[D];哈尔滨工业大学;2010年

3 赵玉鑫;多媒体感知哈希算法及应用研究[D];南京理工大学;2009年

4 赵杠;对偶连接问题的哈希算法研究[D];复旦大学;2010年

5 胡媛媛;基于视觉模型的图像感知哈希算法研究[D];哈尔滨工业大学;2011年

6 袁鑫攀;基于minwise哈希的文档复制检测的研究及应用[D];中南大学;2012年

7 艾洁;哈罗德·布鲁姆文学批评理论研究[D];山东大学;2011年

8 翟乃海;哈罗德·布鲁姆诗学研究[D];山东师范大学;2012年

相关硕士学位论文 前10条

1 杜研哲;高性能网络流量采集和分析技术的实现[D];北京邮电大学;2017年

2 刘弘;基于Markov图模型的特征哈希算法[D];江西师范大学;2015年

3 杜丹丹;基于稀疏哈希算法的目标跟踪方法研究[D];大连理工大学;2015年

4 倪康康;基于哈希算法的图像检索系统[D];西安电子科技大学;2015年

5 高宪军;半监督哈希算法研究[D];西安电子科技大学;2014年

6 余俊伟;基于局部不变矩和DWT特征矩阵的图像哈希算法[D];广西师范大学;2015年

7 阮林林;基于局部线性嵌入和局部保持投影的图像哈希算法[D];广西师范大学;2015年

8 董献伦;基于关系型数据库的数据切分问题研究[D];山东大学;2016年

9 王建;快速近似近邻检索的哈希方法研究[D];山东大学;2016年

10 李秀琴;基于DWT特征点和方向直方图的图像哈希算法[D];广西师范大学;2016年



本文编号:2345717

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2345717.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b96d9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com