10.12066/j.issn.1007-2861.2283
基于分层标注的中文嵌套命名实体识别
中文命名实体识别在中文信息处理中扮演着重要的角色.在中文信息文本中,许多命名实体内部包含着嵌套实体.然而,已有研究大多聚焦在非嵌套实体识别,无法充分捕获嵌套实体之间的边界信息.采用分层标注方式进行嵌套命名实体识别(nested named entity recognition,NNER),将每层的实体识别解析为一个单独的任务,并通过Gate过滤机制来促进层级之间的信息交换.利用公开的1998年《人民日报》NNER语料进行了多组实验,验证了模型的有效性.实验结果表明,在不使用外部资源词典信息的情况下,该方法在《人民日报》数据集上的F1值达到了 91.41%,有效提高了中文嵌套命名实体识别的效果.
中文信息处理、分层标注、嵌套命名实体识别、Gate过滤机制
28
TP391.1(计算技术、计算机技术)
上海市科委重点资助项目19511102803
2022-11-08(万方平台首次上网日期,不代表论文的发表时间)
共11页
270-280