10.3778/j.issn.1673-9418.2112109
命名实体识别方法研究综述
在自然语言处理领域,命名实体识别是信息抽取的第一个关键环节.命名实体识别任务旨在从大量非结构化的文本中识别出命名实体并将其分类为预定义的类型,为关系抽取、文本摘要和机器翻译等自然语言处理任务提供基础支持.首先概述了命名实体识别的定义、研究难点和中文命名实体识别任务的特殊性,总结了命名实体识别任务中常用的中英文公共数据集和评估标准.然后根据命名实体识别的发展历程调研了现有的命名实体识别方法,主要为早期基于规则和词典的命名实体识别方法、基于统计机器学习的命名实体识别方法和基于深度学习的命名实体识别方法.归纳总结了每一种命名实体识别方法的关键思路、优缺点和具有代表性的模型,同时对各阶段的中文命名实体识别方法进行了总结.特别对最新的基于Transformer和基于提示学习的命名实体识别方法进行了综述,这两种细分类的方法是基于深度学习的命名实体识别方法中最先进的方法.最后总结了命名实体识别研究面临的挑战,并展望了未来的研究方向.
自然语言处理、命名实体识别、机器学习、深度学习、关系抽取
16
TP391(计算技术、计算机技术)
中央级公益性科研院所基本科研业务费专项;国家自然科学基金
2022-09-22(万方平台首次上网日期,不代表论文的发表时间)
共15页
1954-1968