10.3969/j.issn.1672-8262.2016.03.010
Hadoop支持下海量出租车轨迹数据预处理技术研究
海量出租车轨迹数据预处理是轨迹数据挖掘和应用的前提。出租车轨迹数据是典型的大数据,传统的数据处理技术无法解决大规模出租车轨迹数据误差分析和处理问题,文章在分析轨迹数据误差来源和误差类型的基础上,提出基于Hadoop的海量出租车轨迹数据预处理模型,使用Hive实现轨迹数据误差统计分析,设计MapReduce并行处理程序实现轨迹数据预处理。实验结果表明,该模型可以有效解决大规模出租车轨迹数据预处理问题,处理方式可靠性较高,大大提高了轨迹数据预处理效率,为后期轨迹数据深入挖掘和分析奠定了基础。
轨迹数据、Hadoop、大数据、数据预处理、并行计算
P208.1(一般性问题)
2016-07-25(万方平台首次上网日期,不代表论文的发表时间)
共4页
46-49