基于N-Gram静态分析技术的恶意软件分类研究

引用

摘要：

为了解决恶意软件分类准确率不高的问题,提出了一种基于N-Gram静态分析技术的恶意软件分类方法.首先,通过N-Gram方法在恶意软件样本中提取长度为2的字节序列;其次,根据提取的特征利用KNN、逻辑回归、随机森林、XGBoost训练基于机器学习的恶意软件分类模型;然后,使用混淆矩阵和对数损失函数对恶意软件分类模型进行评价;最后,将恶意软件分类模型在Kaggle恶意软件数据集中进行训练和测试.实验结果表明,XGBoost和随机森林的恶意软件分类模型准确率分别达到了98.43％和97.93％,Log Loss值分别为0.022240和0.026946.与已有方法相比,通过N-Gram进行特征提取的方法可以更准确地对恶意软件进行分类,保护计算机系统免受恶意软件的攻击.

关键词：N-Gram、静态分析、机器学习、恶意软件

所属期刊栏目：49

分类号：TP309(计算技术、计算机技术)

资助基金：国家重点研发计划;国家自然科学基金;河北省科技厅科技计划

在线出版日期：2022-08-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：336-343

英文信息展示

期刊专题