10.3778/j.issn.1673-9418.1906031
军用软件测试领域的命名实体识别技术研究
命名实体识别是构建知识图谱的重要阶段.基于国军标及软件测试文档,完成了实体类型分类以及数据集的构建和标注.在软件测试领域,针对字词联合实体识别方法准确率不高的问题,进行字符级特征提取方法的改进,提出了CWA-BiLSTM-CRF识别框架.该框架包含两部分:第一部分构建预训练的字词融合字典,将字词一起输入给双向长短期记忆网络进行训练,并加入注意力机制衡量词内各字对特征的语义贡献,提取出字符级特征;第二部分将字符级特征与词向量等特征进行拼接,输入给双向长短期记忆网络进行训练,再通过条件随机场解决标签结果序列不合理的问题,识别出文中的实体.实验结果分别与三种常用的深度学习字符级特征提取方法进行比较,准确率和召回率均有提升,最优F1值为88.93%.实验表明,改进后的方法适用于军用软件测试领域命名实体识别任务,为下一步知识图谱的构建打下了基础.
软件测试、知识图谱、命名实体识别、双向长短期记忆网络、条件随机场
14
TP391(计算技术、计算机技术)
2020-05-18(万方平台首次上网日期,不代表论文的发表时间)
共9页
740-748