10.3969/j.issn.1007-130X.2017.01.015
基于机器学习的日志函数自动识别方法
随着软件规模的不断增长,日志在故障检测中发挥着愈加重要的作用.然而,目前软件日志缺乏统一标准,常受开发人员个人习惯影响,为大规模系统中日志的自动化分析带来了挑战.其中,日志函数的识别作为日志分析的前提条件,对分析结果有着直接影响.提出了一种基于机器学习的方法以支持日志自动识别.通过系统分析广泛使用的大规模开源软件,总结出日志函数编写的主要形式,并提取不同形式间的共性特征,进而基于机器学习实现了自动日志识别工具iLog.实验显示,使用iLog识别的日志函数能力平均为使用特定关键字的76倍,十折交叉验证得到iLog的分析结果的F-Score为0.93.
日志函数、机器学习、静态分析、代码质量、故障检测
39
TP311.5(计算技术、计算机技术)
国家自然科学基金61379146,61272483;腾讯高校合作项目“面向故障检测的大规模开源软件日志增强技术研究”
2017-03-07(万方平台首次上网日期,不代表论文的发表时间)
共7页
111-117