基于MapReduce的电信客户流失决策树算法研究
针对传统的关系型数据管理技术在电信企业面对海量数据对客户流失进行分析研究时存在的海量存储能力和计算能力不足的问题,提出了一种基于MapReduce架构的并行决策树算法,该算法采用校正系数来避免ID3算法多值偏向问题,并应用于客户流失分析中。在Hadoop集群平台上的结果分析表明:基于MapReduce并行模型能够解决电信企业进行客户流失分析时处理大规模数据的问题,在保证分类准确率的情况下能获得趋近线性的加速比,并具有较好的扩展性。
MapReduce、决策树、客户流失
TP274(自动化技术及设备)
2013-11-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
6710-6713,6716