10.11896/j.issn.1002-137X.2016.8.030
流数据Top-K关键字查询算法
基于Spark Streaming计算框架的分布式Top-K关键字查询是统计流数据中所有关键字的热点研究问题.多数研究通过限定存储空间来实现Top-K关键字查询,并假设关键字集合已知.针对这个问题,提出一种可应用于关键字集合未知情况的分布式Top-K关键字查询算法,根据监测到的关键字动态地调整存储空间,通过更新策略的优化提升其精度.实验结果表明,该算法的性能在关键字集合未知的情况下比现有算法更优.
Top-K关键字查询、流数据、云计算、Spark Streaming
43
TP311(计算技术、计算机技术)
国家自然科学基金项目61373015,61300052;江苏高校优势学科建设工程资助项目;江苏省重大科技成果转化基金项目BA2013049
2016-10-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
142-147