高性能网络流量采集和分析技术的实现
[Abstract]:The 21st century is the era of information technology. With the improvement of network technology, the development of information technology and the progress of computer science, information technology permeates into every corner of people's life, and it can work and learn for people. Life brings great convenience. In recent years, with the rapid development of the Internet and the explosive increase of the network bandwidth, the development of high-speed network has brought convenience to people's life and promoted the development of the industry. At the same time, the increasingly developing high-speed network has also posed a difficult problem for the design of software system. First of all, the problem of high-speed network data flow collection. In order to statistics the network status, it is necessary to grasp and analyze the traffic. This technology has been widely used in network monitoring, information security, and so on. However, with the explosive growth of network traffic, the malpractice of traditional packet capture has begun to appear. In order to improve this situation, scholars at home and abroad have made unremitting efforts. In recent years, the development of, DPDK (Intel Data Plane Development Kit) high performance packet processing framework makes it possible to capture packets in high speed networks. In this paper, the DPDK technology will be briefly introduced. Among the high performance data analysis techniques, the hash algorithm has always occupied a place. The traditional hash algorithm has shown high performance in storage. However, in the face of complex and changeable high-speed network, the performance and robustness of the classical hash algorithm are sometimes slightly inadequate. This paper focuses on the optimization of hash algorithm in high speed and high speed concurrent networks. In this paper, we will optimize the existing hash algorithms in three aspects. First, we propose two universal Cache algorithms, PBS-CPE and Cuckoo_Cache.. These two algorithms can improve the query _ efficiency without changing the uniformity of the hash algorithm. Then the insertion performance of the cuckoo hashing algorithm is optimized to increase the number of hash functions and set the overflow stack. Finally, two optimization methods are proposed for the performance of piecewise hash algorithm in high-speed network: minimum subscript method and iterative updating algorithm of Bloom filter. According to these two optimization methods, a multi-segment hash algorithm with skew characteristics is proposed. The performance of this algorithm is better than that of piecewise hash algorithm in high speed and high concurrency network environment. In this paper, a high speed and high concurrency network flow management system is designed. The system uses DPDK technology to collect data packets, and uses various hash algorithms to store data packets. The performance data of the hashing algorithm is generated at the same time when the packet is processed, and the performance data is written to the local log at the end of the statistics for the subsequent performance comparison. At the same time, in this paper, the hashing algorithms and the proposed optimization aspects are compared. Through the experimental data, we can see that PBS-CPE and Cuckoo_Cache cache algorithms can improve the query efficiency of the hash algorithm. The two optimization methods for the cuckoo hashing algorithm can greatly improve the insertion performance and robustness of the cuckoo hashing algorithm when the capacity of the cuckoo hash table is not high. The iterative updating method of the Bloom filter can reduce the false positive rate of the Bloom filter, so it can improve the query performance to some extent. Multi-segment hash algorithm with skew characteristics has better query performance than segmented hash algorithm in the specific environment of high-speed network.
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.0;TP274.2
【相似文献】
相关期刊论文 前10条
1 黄云轲;辛小龙;李成龙;李聿民;;关于对哈希算法的研究与应用[J];计算机光盘软件与应用;2012年03期
2 陈一骄;卢锡城;孙志刚;;面向流管理的哈希算法研究[J];计算机工程与科学;2008年04期
3 邹保平;;基于一致哈希算法的用电信息采集系统研究[J];电力信息化;2011年06期
4 刘华珠;贺前华;;基于哈希算法的网络桥接器地址维护方法(英文)[J];科学技术与工程;2008年17期
5 王远;;可重构哈希算法芯片的设计与实现[J];电脑知识与技术;2012年04期
6 张江,傅鹤岗;基于关联规则的二维哈希算法的改进[J];计算机工程与设计;2005年08期
7 唐铭;史长琼;周恺卿;张大方;;倒插入分段哈希算法[J];计算机应用;2011年02期
8 孙阳;朱宏峰;刘天华;;一种新型抗旋转攻击的鲁棒哈希算法[J];小型微型计算机系统;2011年04期
9 贺贤明,邵雷兵;一种基于学习的自适应哈希算法研究[J];计算机应用与软件;2004年11期
10 邵雷兵,庄毅;一种基于学习的自适应哈希算法研究[J];微电子学与计算机;2004年08期
相关会议论文 前3条
1 刘宗斌;马原;荆继武;夏鲁宁;;SM3哈希算法的硬件实现与研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
2 文振q;朱为总;欧阳杰;高金花;;一种鲁棒可区分的视频感知哈希算法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
3 文振q;高金花;刘朋飞;杜以华;张萌;;基于分块DCT和PCA的图像感知哈希算法研究[A];第十五届全国图象图形学学术会议论文集[C];2010年
相关重要报纸文章 前10条
1 徐鲁 作家,,书评人;布鲁姆博士的快乐哲学[N];中国图书商报;2007年
2 钱文亮;布鲁姆的影响诗学与修正理论[N];中华读书报;2001年
3 乔纳森;称赏者布鲁姆[N];东方早报;2011年
4 王敖;布鲁姆的“最佳英语诗歌”[N];21世纪经济报道;2006年
5 贾晓伟;文学,不可遗忘的废黜之王[N];北京日报;2011年
6 张龙海;哈罗德·布鲁姆的文学观[N];文艺报;2011年
7 许知远;想起了艾伦·布鲁姆[N];经济观察报;2005年
8 山东社科院 战旭英;艾伦·布鲁姆:美国精神的没落[N];社会科学报;2007年
9 冯克利;以古典情怀针砭现代性困局[N];南方周末;2007年
10 本报记者 周帆 陈姗姗;特里·布鲁姆:全球化和多元化比专业化更重要[N];第一财经日报;2005年
相关博士学位论文 前8条
1 金仲明;基于哈希算法的海量多媒体数据检索研究[D];浙江大学;2015年
2 焦玉华;音频感知哈希算法研究[D];哈尔滨工业大学;2010年
3 赵玉鑫;多媒体感知哈希算法及应用研究[D];南京理工大学;2009年
4 赵杠;对偶连接问题的哈希算法研究[D];复旦大学;2010年
5 胡媛媛;基于视觉模型的图像感知哈希算法研究[D];哈尔滨工业大学;2011年
6 袁鑫攀;基于minwise哈希的文档复制检测的研究及应用[D];中南大学;2012年
7 艾洁;哈罗德·布鲁姆文学批评理论研究[D];山东大学;2011年
8 翟乃海;哈罗德·布鲁姆诗学研究[D];山东师范大学;2012年
相关硕士学位论文 前10条
1 杜研哲;高性能网络流量采集和分析技术的实现[D];北京邮电大学;2017年
2 刘弘;基于Markov图模型的特征哈希算法[D];江西师范大学;2015年
3 杜丹丹;基于稀疏哈希算法的目标跟踪方法研究[D];大连理工大学;2015年
4 倪康康;基于哈希算法的图像检索系统[D];西安电子科技大学;2015年
5 高宪军;半监督哈希算法研究[D];西安电子科技大学;2014年
6 余俊伟;基于局部不变矩和DWT特征矩阵的图像哈希算法[D];广西师范大学;2015年
7 阮林林;基于局部线性嵌入和局部保持投影的图像哈希算法[D];广西师范大学;2015年
8 董献伦;基于关系型数据库的数据切分问题研究[D];山东大学;2016年
9 王建;快速近似近邻检索的哈希方法研究[D];山东大学;2016年
10 李秀琴;基于DWT特征点和方向直方图的图像哈希算法[D];广西师范大学;2016年
本文编号:2345717
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2345717.html