10.11772/j.issn.1001-9081.2021030486
基于代码图像合成的Android恶意软件家族分类方法
代码图像化技术被提出后在Android恶意软件研究领域迅速普及.针对使用单个DEX文件转换而成的代码图像表征能力不足的问题,提出了一种基于代码图像合成的Android恶意软件家族分类方法.首先,将安装包中的DEX、XML与反编译生成的JAR文件进行灰度图像化处理,并使用Bilinear插值算法来放缩处理不同尺寸的灰度图像,然后将三张灰度图合成为一张三维RGB图像用于训练与分类.在分类模型上,将软阈值去噪模块与基于Split-Attention的ResNeSt相结合提出了STResNeSt.该模型具备较强的抗噪能力,更能关注代码图像的重要特征.针对训练过程中的数据长尾分布问题,在数据增强的基础上引入了类别平衡损失函数(CB Loss),从而为样本不平衡造成的过拟合现象提供了解决方案.在Drebin数据集上,合成代码图像的准确率领先DEX灰度图像2.93个百分点,STResNeSt与残差神经网络(ResNet)相比准确率提升了1.1个百分点,且数据增强结合CB Loss的方案将F1值最高提升了2.4个百分点.实验结果表明,所提方法的平均分类准确率达到了98.97%,能有效分类Android恶意软件家族.
Android恶意软件家族、代码图像、迁移学习、卷积神经网络、通道注意力
42
TP309.5(计算技术、计算机技术)
公共安全行为科学实验室开放课题2020SYS06
2022-06-27(万方平台首次上网日期,不代表论文的发表时间)
共10页
1490-1499