10.11896/j.issn.1002-137X.2017.02.047
基数估计算法参数的分析与优化
基数估计算法(Cardinality Estimation Algorithrn)是基于概率统计理论的估算给定数据集中不重复元素基数的算法.算法中的Hash函数和相关参数的设置是影响算法性能的两个关键因素.针对这两个问题展开研究,提出了一种基数估计的优化算法,它可以根据数据规模和数据类型动态调整Hash函数和分桶参数,以提高算法的精度和稳定性.实验结果表明,改进的基数估计算法在经过训练之后,相比传统估计算法,其估计精度和稳定性均有所提高.
基数估计、Hash函数、训练
44
TP301.6(计算技术、计算机技术)
2015年度广东省高等教育教学改革项目:基于敏捷开发的软件项目实践课程迭代式教学模式设计与实践,广东省水利科技创新项目成果2014-16;国家自然科学基金项目61379019;四川省科技计划项目2015JY002
2017-04-10(万方平台首次上网日期,不代表论文的发表时间)
共5页
279-282,301