10.19678/j.issn.1000-3428.0061596
融入事件实体知识的汉越跨语言新闻事件检索
现有汉越跨语言新闻事件检索方法较少使用新闻领域内的事件实体知识,在候选文档中存在多个事件的情况下,与查询句无关的事件会干扰查询句与候选文档间的匹配精度,影响检索性能.提出一种融入事件实体知识的汉越跨语言新闻事件检索模型.通过查询翻译方法将汉语事件查询句翻译为越南语事件查询句,把跨语言新闻事件检索问题转化为单语新闻事件检索问题.考虑到查询句中只有单个事件,候选文档中多个事件共存会影响查询句和文档的精准匹配,利用事件触发词划分候选文档事件范围,减小文档中与查询无关事件的干扰.在此基础上,利用知识图谱和事件触发词得到事件实体丰富的知识表示,通过查询句与文档事件范围间的交互,提取到事件实体知识表示与词以及事件实体知识表示之间的排序特征.在汉越双语新闻数据集上的实验结果表明,与BM25、Conv-KNRM、ATER等基线模型相比,该模型能够取得较好的跨语言新闻事件检索效果,NDCG和MAP指标最高可提升0.712 2和0.587 2.
跨语言检索、事件实体、事件触发词、事件范围、排序学习、事件检索
48
TP18(自动化基础理论)
国家自然科学基金;国家自然科学基金;国家自然科学基金;国家重点研发计划;国家重点研发计划;国家重点研发计划;云南省重大科技专项;云南省高科技人才项目;云南省高科技人才项目;云南省基础研究计划项目;云南省基础研究计划项目
2022-09-05(万方平台首次上网日期,不代表论文的发表时间)
共10页
274-282,291