一种基于多任务学习的代码补全方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.19734/j.issn.1001-3695.2022.08.0396

一种基于多任务学习的代码补全方法

引用
针对基于语言模型的代码补全方法忽略源代码中结构信息和命名信息而导致补全准确率偏低的问题,提出一种基于多任务学习的代码补全方法(multi-task learning code completion,MTLCC).MTLCC对源代码数据集进行数据清洗和预处理,通过抽象语法树(abstract syntax tree,AST)提取源代码中的结构信息和命名信息;构建基于Transformer的多任务学习网络,采用软参数共享学习方式分别对源代码的节点类型预测、节点值预测和语句预测进行训练;利用集束搜索对模型推理结果进行后期处理生成代码补全建议列表.实验结果表明,与Pointer network、LSTM+TransformerXL和CodeGPT中最好的模型相比,MTLCC在节点类型预测和节点值预测任务中的准确率分别提升了 2.5%和1.7%、MRR分别提升了 3.7%和2.4%,在语句预测任务中的ROUGE-L分数(L@4)提升了 0.055.

代码补全、多任务学习、抽象语法树、Transformer、集束搜索

40

TP391(计算技术、计算机技术)

四川省重点研发项目2020YFG0299

2023-03-16(万方平台首次上网日期,不代表论文的发表时间)

共5页

863-867

相关文献
评论
暂无封面信息
查看本期封面目录

计算机应用研究

1001-3695

51-1196/TP

40

2023,40(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn