基数估计算法参数的分析与优化
本文选题:基数估计 + Hash函数 ; 参考:《计算机科学》2017年02期
【摘要】:基数估计算法(Cardinality Estimation Algorithm)是基于概率统计理论的估算给定数据集中不重复元素基数的算法。算法中的Hash函数和相关参数的设置是影响算法性能的两个关键因素。针对这两个问题展开研究,提出了一种基数估计的优化算法,它可以根据数据规模和数据类型动态调整Hash函数和分桶参数,以提高算法的精度和稳定性。实验结果表明,改进的基数估计算法在经过训练之后,相比传统估计算法,其估计精度和稳定性均有所提高。
[Abstract]:Cardinality Estimation algorithm is an algorithm based on probability and statistics theory to estimate the cardinality of non-repeated elements in a given data set. The setting of Hash function and related parameters are two key factors that affect the performance of the algorithm. In order to improve the accuracy and stability of the algorithm, an optimization algorithm for cardinality estimation is proposed, which can dynamically adjust the Hash function and bucket parameters according to the data size and data type. The experimental results show that the improved radix estimation algorithm is more accurate and stable than the traditional estimation algorithm after training.
【作者单位】: 华南师范大学计算机学院;西南民族大学计算机科学与技术学院;
【基金】:2015年度广东省高等教育教学改革项目:基于敏捷开发的软件项目实践课程迭代式教学模式设计与实践 广东省水利科技创新项目成果(2014-16) 国家自然科学基金项目(61379019) 四川省科技计划项目(2015JY002)资助
【分类号】:O212.1
【相似文献】
相关期刊论文 前4条
1 刘建东;江慧娜;杨凯;;一种新型的具有可变散列输出的Hash函数[J];武汉大学学报(理学版);2010年02期
2 张楠;陈建英;傅春常;;基于Hash函数的RFID双向认证协议[J];西南民族大学学报(自然科学版);2012年06期
3 杜红珍,张建中;一种新的秘密分享方案[J];淮海工学院学报(自然科学版);2005年02期
4 ;[J];;年期
相关会议论文 前1条
1 赵婷;王健;;基于Hash函数的RFID动态认证协议[A];2010年全国通信安全学术会议论文集[C];2010年
相关硕士学位论文 前10条
1 张文婷;多变量混沌Hash函数的构造与安全性分析[D];长沙理工大学;2014年
2 谭雪;基于混沌动力学的Hash函数的研究[D];北京邮电大学;2015年
3 袁阳;基于时空混沌的Hash函数研究[D];西安电子科技大学;2009年
4 金鑫;基于混沌映射的Hash函数在RFID安全协议中的应用[D];上海交通大学;2009年
5 朱小兵;基于统计随机性的Hash函数安全评估模型研究[D];西南交通大学;2012年
6 李克荣;基于网络编码和Hash函数的一个保密通信方案[D];扬州大学;2010年
7 石春华;一种基于Hash函数的RFID安全认证协议的设计与实现[D];电子科技大学;2013年
8 梁焕琪;基于Hash函数和公钥加密的RFID认证协议的研究[D];华南理工大学;2012年
9 李志全;基于Hash函数的RFID安全认证协议的研究与设计[D];太原科技大学;2011年
10 卜坤;基于有限域上多变量Hash函数的构造与分析[D];西安电子科技大学;2013年
,本文编号:1836278
本文链接:https://www.wllwen.com/kejilunwen/yysx/1836278.html