10.3969/j.issn.1671-1122.2022.06.002
机器学习在x86二进制反汇编中的应用研究综述
二进制反汇编技术是二进制漏洞检测、控制流完整性和代码相似度检测的核心.传统反汇编技术高度依赖于预先定义的启发式规则和专家知识,在函数识别、变量类型识别、控制流生成等任务中应用效果不够好.机器学习在序列和图数据结构处理上的发展为二进制分析注入了新活力,弥补了传统二进制逆向技术的缺陷,推动了二进制分析研究工作.文章从机器学习在x86二进制反汇编中的应用入手,对函数识别、函数指纹复原、数据流生成等任务的相关工作进行调研分析,首先总结反汇编的传统技术及难点;然后提炼在x86二进制反汇编中应用机器学习的一般工作模式,包括二进制特征提取、特征向量化、模型训练及评估,并依据特征包含的信息和嵌入方式分别对特征提取和向量化过程的方法进行分类,同时依据具体工作总结机器学习模型训练中的重要技术;最后基于研究现状总结已有工作的局限性和面临的挑战,阐述未来可能的研究方向.
反汇编、机器学习、软件安全、逆向工程
TP309(计算技术、计算机技术)
国家电网有限公司总部科技项目520940210009
2022-07-04(万方平台首次上网日期,不代表论文的发表时间)
共17页
9-25