10.3969/j.issn.1001-3695.2014.11.042
Ya rn架构下基于G A的We b日志挖掘技术
提出了一种面向TB级别日志文件挖掘需求的日志挖掘技术。采用MapReduce编程模型设计并实现了一种基于子种群联姻策略的GA,并部署到Yarn架构上,使Yarn架构与GA有效结合。在算法Partition阶段,采用Round-Robin策略代替原有的哈希方法,使各个子种群基因更加趋向均匀分布,增加了子种群收敛效率和结果准确性,同时均衡各个节点运行负载,提高了系统性能。经测试,应用该技术的挖掘结果平均准确度达到93%以上,效率提升接近33%。
Yarn架构、日志挖掘、遗传算法、并行计算
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61003036;黑龙江省自然科学基金资助项目F201124;黑龙江省教育厅科学技术研究基金资助项目12513048
2014-11-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
3388-3391