10.3778/j.issn.1002-8331.2109-0494
融合多特征图及实体影响力的领域实体消歧
实体消歧作为自然语言处理的关键问题,旨在将文本中出现的歧义实体指称映射到知识库中的目标实体.针对现有方法存在仅实现单实体指称消歧、忽略了实体影响力及候选实体间相似度对消歧结果的影响以及冗余图节点增加图计算复杂性等问题,提出了一种融合多特征图及实体影响力的领域实体消歧方法,以金融领域为例,提取CN-Dbpedia中金融类别相关关键词三元组,构建金融领域知识库;针对金融活动类文本,提取待消歧实体指称,融合字符串及语义的相似特征,筛选出候选实体,利用知识库三元组信息获取候选实体间2-hop内的关系,同时计算候选实体间相似度作为边权值,进而将多特征信息充分融合到图模型当中,完成多特征图构建;采用动态决策策略,利用PageRank算法,并结合实体影响力计算多特征图中候选实体的综合评分,进而获得可信度较高的消歧结果.实验结果验证了提出方法在特定领域实体消歧的精确度及效率.
领域实体消歧、实体链接、多特征图、实体影响力、知识库
59
TP311(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;中国博士后基金面上项目;辽宁省教育厅科学研究项目;辽宁省公共舆情与网络安全大数据系统工程实验室
2023-03-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
305-311