10.3969/j.issn.1000-1220.2021.10.021
一种提升细粒度日志解析准确度的方法
目前大多数系统日志存在不同比例的细粒度日志,现有的日志解析器无法正确解析这些日志,导致整体解析准确度不高的问题.为了提升日志解析的整体准确度,加快日志解析过程,解决长度可变的及含有状态变量的细粒度日志错误分类的问题,本文提出了结合日志的常量令牌长度特征的决策树日志解析模型(CLDT).模型主要包括数据预处理、决策树搜索、相似度计算与事件生成、更新决策树.实验采用开源日志集HDFS、HPC、Zookeeper进行了测试.实验结果表明,CLDT能有效地解决细粒度日志分类的问题,总体性能优于经典的Drain、Spell、IPLom算法,获得更高的F-mesure和准确度.
细粒度日志;日志解析;决策树;常量令牌长度
42
TP311(计算技术、计算机技术)
国家自然科学基金项目F020804
2021-10-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
2140-2144