10.3969/j.issn.1007-130X.2023.01.003
基于Flink的k-支配skyline体并行求解算法
k-支配skyline算法弱化了数据点之间的支配关系,更适合高维数据.k-支配skyline体适应于多名用户使用k-支配skyline算法查询,而现有的求解算法在时间效率和代码扩展性方面都有待提高.因此,提出了面向多用户的k-支配skyline体求解优化算法MKSSOA,该算法对每名用户的候选集和中间集分别进行存储,同时在k-支配检查过程中利用2集合中数据点出现的先后次序将候选集中的非k-支配skyline点存储到对应用户的中间集中,以便下一名用户筛选使用,这样可以减少数据点之间的比较次数,避免重复计算,从而提升查询效率.同时,提出了面向多用户的k-支配skyline体并行求解算法MK-SPSA,通过Apache Flink并行处理框架有效减少了数据点的比较时间.理论研究和实验结果显示,提出的算法具有较高的效率,能很好地处理多用户k-支配skyline问题.
k-支配、skyline查询、多用户、Apache Flink、并行查询
45
TP311.13(计算技术、计算机技术)
国家重点研发计划2018YFB1004402
2023-02-15(万方平台首次上网日期,不代表论文的发表时间)
共11页
17-27