10.3969/j.issn.2095-2163.2012.05.012
面向大规模日志数据的聚类算法研究
针对大规模日志数据的聚类问题,提出了DBk-means算法.该算法使用Hadoop对原始日志数据进行预处理,并结合了k-means和DBSCAN聚类算法各自的优势.实验结果表明,相比k-means算法进行聚类分析,文中使用DBk-means算法进行聚类,能够取得更好的聚类效果,正确率可以达到83%以上.
聚类算法、k-means算法、DBSCAN算法、大规模数据
2
TP391(计算技术、计算机技术)
国家自然科学基金60975077
2012-11-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
42-45