10.3778/j.issn.1673-9418.1908022
S-C特征提取的计算机漏洞自动分类算法
近年来未知的计算机漏洞数量呈海量增长状态,对于大量的漏洞数据进行及时准确的分析和分类管理,是十分重要且有待解决的问题.因此,提出一种基于信息熵与综合函数(S-C)特征提取,并利用关联了特征词集间相互关系的平均一阶依赖贝叶斯模型(AODE)分类器的分类方法对计算机漏洞描述信息进行文本分类.首先,利用S-C特征提取法提取特征词.通过结合词语的类间重要程度和类内重要程度的综合函数C,计算出词语对于类别的重要程度.再利用词语对于类别间的信息熵S,来弱化对于分类较为混乱的词语的重要程度,选取得到准确的特征词集.最后,利用关联了特征词集间相互关系的AODE对漏洞数据集进行分类.通过实验对比表明,S-C特征提取法能够提取准确的特征词集,并且结合AODE分类器的分类准确率要高于传统的分类器模型.
计算机漏洞、文本分类、特征提取、信息熵
14
TP391(计算技术、计算机技术)
The National Natural Science Foundation of China under Grant Nos. 61472341, 61772449, 61572420, 61807028, 61802332 国家自然科学基金
2020-07-14(万方平台首次上网日期,不代表论文的发表时间)
共10页
1173-1182