10.3969/j.issn.1000-1220.2021.03.036
Stack Overflow的缺陷代码特征分析与相似缺陷检测
目前在软件代码缺陷审查以及缺陷预测中,研究人员对源代码进行分析研究却忽略了代码的缺陷信息.本文通过对缺陷信息进行分析,发现缺陷信息对于相似缺陷的检测有着重要的参考价值.基于这一思想,本文分析软件缺陷社区Stack Over-flow中关于缺陷代码的信息,提出一种基于缺陷代码特征分析的相似缺陷检测方法.该方法首先对缺陷报告进行LDA主题分析并将缺陷报告分类到不同的主题(类别)中,统计得到高频缺陷类别;其次对于高频缺陷类别的缺陷代码提取特征;最后根据缺陷代码特征构建相似缺陷检测模型.为了验证相似缺陷检测模型的有效性,针对数据操作缺陷数据构建诊断模型并对该模型进行实证,实验结果表明该方法对检测其他代码中相似缺陷有较好的效果.
StackOverflow、LDA、缺陷代码特征、特征相似度、相似缺陷检测
42
TP391(计算技术、计算机技术)
国家自然科学基金项目61803264
2021-03-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
661-665