10.3969/j.issn.1673-629X.2013.03.006
朴素贝叶斯算法的MapReduce并行化分析与实现
朴素贝叶斯方法是一种高效的分类算法,但在处理海量数据时由于内存和I/O等资源的局限,该算法的效率受到极大影响.文中针对朴素贝叶斯分类算法特点,给出了基于MapReduce编程模型的实现朴素贝叶斯分类算法的方法.训练集内文件被分割进行处理,核心处理过程由MapReduce完成,Map函数完成对训练文件的解析,Reduce函数完成类别属性和特征属性知识库的构建.实验主要比较了传统算法和改进并行算法的性能,结果表明:在大数据量的情况下使用Ma-pReduce并行化的朴素贝叶斯算法具有良好的执行效率与较高的扩展性.
朴素贝叶斯分类算法、并行计算、MapReduce
TP31(计算技术、计算机技术)
2013-04-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
23-26