一种基于聚集系数的人名识别方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1000-3428.2016.07.034

一种基于聚集系数的人名识别方法

引用
在中文文本分析的许多应用领域中,人名识别是一个广泛存在且受到持续关注的基本问题.虽然目前人名识别方法较多,但大多以语料统计和语言规则为基础.为此,针对事件文本中人名具有紧密联系的特征,基于聚集系数,提出一种新的人名识别方法.利用姓氏列表获得原始文本中的可能姓氏信息,基于人名语料信息所构建的统计模型和上下文新的信息提取出候选人名,定义人际语义相似性、人名可能度等量化方法,在此基础上设计一种基于人际网络聚集系数的人名过滤方法.实验结果表明,与现有基于隐马尔可夫模型的方法相比,该方法所获得的F1值有1.2%的提升,并且不需要人工标注语料及使用语言规则.

人名识别、聚集系数、人际网络、统计模型、人际语义相似性

42

TP309(计算技术、计算机技术)

2016-09-22(万方平台首次上网日期,不代表论文的发表时间)

共6页

203-208

相关文献
评论
暂无封面信息
查看本期封面目录

计算机工程

1000-3428

31-1289/TP

42

2016,42(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn