10.3969/j.issn.1672-7169.2015.04.025
分布式数据流分类关键技术研究
随着数据采集和生成技术的不断成熟,能够生成数据流的应用越来越多,近些年,网络应用进一步普及,单一数据流的应用向着多节点的分布式数据流方向转移,如传感器网络、网络监控、WEB日志以及多站点的信用卡交易数据.这些数据不仅具有实时、连续、规模大的特点,还具有分布式的特征,如何管理和分析大规模的分布式的动态数据集,是研究人员面临的重要课题.针对这种现状,本文给出了同构分布式数据流和异构分布式数据流的形式化描述,分析了集中式流处理架构与分布式流处理架构的优势与不足,讨论了分布式数据流分类算法的最新进展,归纳了分布式数据流挖掘面临的问题和挑战,以及未来可能的研究方向.
分布式数据流、数据挖掘、分类
12
TP311.13(计算技术、计算机技术)
中央高校基本科研业务费资助3142014096,3142014087,3142014125,3142013098
2015-12-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
119-124