面向国防科技领域的技术和术语识别方法研究
随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱.而面向国防科技领域的技术和术语识别是构建该领域技术知识图谱的基础.文中基于该领域的语料库,在技术和术语识别的任务上,探索了子词单元在传统序列标注Bi-LSTM+CRF模型上的应用.此外,针对任务的特点,提出了适用于技术和术语识别的语言学特征.基于该领域的语料库,实验结果表明技术和术语识别的F 1值达到了71.80%,较基准系统提升了3.04%,能够较好地识别出面向国防科技领域的技术和术语.同时,所提方法也优于基于BERT模型的技术术语识别方法.
面向国防科技领域、技术和术语、子词、Bi-LSTM+CRF模型、语言学特征
46
TP391.1(计算技术、计算机技术)
国家自然基金项目重点项目61836007;面上项目61772354,61773276
2020-01-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
231-236