DOI：10.11772/j.issn.1001-9081.2019050953

基于VGGNet的恶意代码变种分类

引用

摘要：

针对代码复用在同一恶意家族样本中普遍存在的现象,提出了一种利用代码复用特征的恶意样本分类方法.首先将文件的二进制序列分割成RGB三色通道的值,从而将恶意样本转换为彩色图;然后用这些图片基于VGG卷积神经网络生成恶意样本分类模型;最后在模型训练阶段利用随机失活算法解决过拟合和梯度消失问题以及降低神经网络计算开销.该方法使用Malimg数据集25个族的9342个样本进行评估,平均分类准确率达96.16％,能有效地分类恶意代码样本.实验结果表明,与灰度图相比,所提方法将二进制文件转换为彩色图能更明显地强调图像特征,尤其是对于二进制序列中含有重复短数据片段的文件,而且利用特征更明显的训练集,神经网络能生成分类效果更好的分类模型.所提方法预处理操作简单,分类结果响应较快,因此适用于大规模恶意样本的快速分类等即时性要求较高的场景.

关键词：恶意代码分类、数据可视化、深度学习、随机失活、卷积神经网络

所属期刊栏目：40

分类号：TP309(计算技术、计算机技术)

在线出版日期：2020-04-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：162-167

英文信息展示

期刊专题