基于上下文语义的新闻人名纠错方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1001-0548.2019.06.002

基于上下文语义的新闻人名纠错方法

引用
新闻文本中的人名纠错存在以下难点:1)人名中含有错误字段会影响甚至改变文本语义表达,故无法用传统命名实体识别方法识别句中人名;2)人名字段的特殊性极易产生重名或者歧义,使得误报率增加,并提升了人名纠错的难度.为此,本文提出了一种基于上下文语义的新闻人名纠错方法.该方法使用卷积神经网络提取文本语义信息,并使用词激活力模型计算文本中其他词语与人名字段的关联程度来捕捉并使用文本上下文语义信息.同时,针对文本中人名字段中含有错误而导致的识别效果低下的问题,使用人名实体边界识别算法提高对文本中疑似含有错误人名的识别提取效果.实验结果表明,该方法能够有效地识别文本中的人名并对其中的错误内容进行纠正.

边界识别、上下语义、命名实体识别、人名纠错

48

TP391.1(计算技术、计算机技术)

国家自然科学基金联合基金重点项目U1836205;国家自然科学基金重大研究计划91746116;贵州省自然科学基金黔科合基础[2018]1035;黔科合重大专项字[2018]3002;贵州省重大应用基础研究项目黔科合JZ字[2014]2001;贵州省科技重大专项计划黔科合重大专项字[2017]3002

2019-12-19(万方平台首次上网日期,不代表论文的发表时间)

共6页

809-814

相关文献
评论
暂无封面信息
查看本期封面目录

电子科技大学学报

1001-0548

51-1207/T

48

2019,48(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn