10.3778/j.issn.1002-8331.2106-0368
深度学习在代码表征中的应用综述
代码表征是对代码数值化的一种技术,把代码映射为一组连续的实值向量,提取隐藏在代码内部的属性,辅助程序员生成或分析代码,是代码克隆、代码推荐、代码剽窃等软件工程任务的核心技术和研究热点.研究者们对代码表征方面进行了一系列研究,根据源代码抽取信息的方式,分为基于文本的表征、基于语法的表征、基于语义的表征和基于功能的表征;根据表征粒度的大小,分为基于词汇的表征、基于语句的表征、基于函数的表征等不同等级;根据表征方法的不同,分为基于统计的模型、基于自然语言的模型和基于深度学习的模型.对近几年基于深度学习的代码表征研究进展进行了综述,并从表征粒度、表征层次、表征模型、应用场景等方面对现有工作进行了概括、比较和分析.对基于深度学习的代码表征的未来发展趋势进行分析和展望.
深度学习;代码表征;表征模型;表征粒度
57
TP391(计算技术、计算机技术)
国家自然科学基金;江苏省高等学校大学生创新创业训练计划项目;教育部产学合作协同育人项目
2021-10-29(万方平台首次上网日期,不代表论文的发表时间)
共11页
53-63