基于深度学习和指代消解的中文人名识别
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11871/jfdc.issn.2096-742X.2022.02.006

基于深度学习和指代消解的中文人名识别

引用
[目的]命名实体识别是自然语言处理领域的一项基本任务,实体包括人名、地名和组织名等,与其他实体相比,人名与职务、职务变更及人称代词有关.人名的实体识别中,人名语料的残缺及人称指代不明等问题,成为处理中的难点、痛点.基于此观察,本文提出一种融合指代消解的序列标注方法来改进人名识别,这可以有效缓解人名识别中人名语料不完善的问题,并且可以解决人称代词指代不明、人力耗费量大等问题.[方法]具体地,首先利用职务变更进行数据增强,可以有效解决实际应用中标注数据不足的问题.接着为了更好地学习上下文特征,本文使用语言预训练模型B E RT和双向长短时记忆网络结合的方式,并利用条件随机场建模来标签序列的关系.最后,针对文本中的人称代词,加入指代消解算法,进一步改进人名识别.[结果]在公共数据集和本文提出的数据集上的实验结果均表明本文提出方法的有效性.

命名实体识别、指代消解、BERT、长短时记忆网络

4

TP391;TP18;TN948.64

国家重点研发计划2021YFB0300104

2022-05-09(万方平台首次上网日期,不代表论文的发表时间)

共11页

63-73

相关文献
评论
相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn