云计算平台的海量数据知识提取框架
针对从海量数据中分析与提取知识计算时间高的问题,提出一种基于Hadoop的知识提取算法.本文结合Hadoop的并行处理能力与分布式存储特点,设计了一种知识提取框架,可兼容不同的原型约简方法.基于MapReduce编程方法将约简方法并行化处理,并且设计了分类准确率高、计算速度快的原型约简组合规则.最终基于真实UCI大数据集进行实验,本框架将最近邻分类器的分类时间提高两个数量级.
海量数据、知识提取、原型约简、云计算、并行计算、数据聚类
25
TP3;TN9
广东省自然科学基金S2013010011858;广东省高校优秀青年创新人才培养计划2012LYM0125
2016-12-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
216-220