基于并行计算的文本分类技术
针对传统文本分类方法对于海量数据分类速度慢精度差等问题,将并行计算应用到文本分类领域,设计了一套基于MapReduce的并行化文本分类框架,结合Bagging算法思想提出了支持向量机的并行训练方法,并在Hadoop云计算平台上进行了实验,实验结果表明该分类方法具有较快的分类速度和较高的分类精度.
文本分类、并行计算、支持向量机、MapReduce
33
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目71171148;国家863计划项目2012AA062206;国家科技支撑计划项目2012BAD35B01;上海市科技创新计划项目11DZ1501703
2014-02-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
60-62,66