基于N-Gram静态分析技术的恶意软件分类研究
为了解决恶意软件分类准确率不高的问题,提出了一种基于N-Gram静态分析技术的恶意软件分类方法.首先,通过N-Gram方法在恶意软件样本中提取长度为2的字节序列;其次,根据提取的特征利用KNN、逻辑回归、随机森林、XGBoost训练基于机器学习的恶意软件分类模型;然后,使用混淆矩阵和对数损失函数对恶意软件分类模型进行评价;最后,将恶意软件分类模型在Kaggle恶意软件数据集中进行训练和测试.实验结果表明,XGBoost和随机森林的恶意软件分类模型准确率分别达到了98.43% 和97.93%,Log Loss值分别为0.022240和0.026946.与已有方法相比,通过N-Gram进行特征提取的方法可以更准确地对恶意软件进行分类,保护计算机系统免受恶意软件的攻击.
N-Gram、静态分析、机器学习、恶意软件
49
TP309(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金;河北省科技厅科技计划
2022-08-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
336-343