面向分布式列式存储的轨迹大数据k近邻查询
针对轨迹大数据的高效点-轨迹k近邻(point to trajectory k nearest neighbor,P2T_kNN)查询处理需求,提出了一种融合时空剖分和轨迹分段的轨迹组织方法,其核心思想是在对轨迹作时间剖分的基础上,利用离散全球网格系统(discrete global grid system,DGGS)在空间上进行再次剖分,从而利用两次剖分得到的时空单元编码来索引落入其中的轨迹片段.在此基础上利用分布式列式存储技术设计了面向轨迹大数据的P2T kNN查询处理框架,提出了一种顾及轨迹数据空间分布的自适应空间单元搜索算法,即通过分析轨迹数据在给定时间约束下的空间分异特征,动态调整空间单元的搜索步长,从而提升了轨迹稀疏区域的处理效率.针对亿级轨迹的实验结果表明,该方法适用于轨迹大数据的P2T_kNN查询处理,在轨迹稠密与稀疏区域的平均查询响应时间均小于1s.
轨迹大数据、k近邻查询、时空编码、自适应搜索、分布式列式存储
46
P208(一般性问题)
国家重点研发计划;国家自然科学基金;国家自然科学基金
2021-06-21(万方平台首次上网日期,不代表论文的发表时间)
共10页
736-745