10.3969/j.issn.1001-0548.2019.06.002
基于上下文语义的新闻人名纠错方法
新闻文本中的人名纠错存在以下难点:1)人名中含有错误字段会影响甚至改变文本语义表达,故无法用传统命名实体识别方法识别句中人名;2)人名字段的特殊性极易产生重名或者歧义,使得误报率增加,并提升了人名纠错的难度.为此,本文提出了一种基于上下文语义的新闻人名纠错方法.该方法使用卷积神经网络提取文本语义信息,并使用词激活力模型计算文本中其他词语与人名字段的关联程度来捕捉并使用文本上下文语义信息.同时,针对文本中人名字段中含有错误而导致的识别效果低下的问题,使用人名实体边界识别算法提高对文本中疑似含有错误人名的识别提取效果.实验结果表明,该方法能够有效地识别文本中的人名并对其中的错误内容进行纠正.
边界识别、上下语义、命名实体识别、人名纠错
48
TP391.1(计算技术、计算机技术)
国家自然科学基金联合基金重点项目U1836205;国家自然科学基金重大研究计划91746116;贵州省自然科学基金黔科合基础[2018]1035;黔科合重大专项字[2018]3002;贵州省重大应用基础研究项目黔科合JZ字[2014]2001;贵州省科技重大专项计划黔科合重大专项字[2017]3002
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
809-814