基于知识增强的中文命名实体识别

引用

摘要：

基于字词联合的中文命名实体识别模型能够兼顾字符级别与词语级别的信息,但受未登录词影响较大且在小规模数据集上存在训练不充分等问题.在现有LR-CNN模型的基础上,提出一种结合知识增强的中文命名实体识别模型,采用相对位置编码的多头注意力机制提高模型上下文信息捕捉能力,通过实体词典融入先验知识降低未登录词的影响并增强模型学习能力.实验结果表明,该模型在保持较快解码速度和较低计算资源占用量的情况下,在MSRA、People Daily、Resume、Weibo数据集上相比SoftLexicon、FLAT等模型F1值均有明显提升,同时具有较强的鲁棒性和泛化能力.

关键词：中文命名实体识别;注意力机制;知识增强;未登录词;小规模数据集

所属期刊栏目：47

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金青年基金;国家重点研发计划;郑州市协同创新重大专项

在线出版日期：2021-11-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：84-92

英文信息展示

期刊专题