10.13705/j.issn.1671-6841.2021297
基于混合相似度度量的跨语言舰船实体匹配算法
由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题.从这些问题出发,提出了一种跨语言舰船实体匹配算法.首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率.还设计了捕捉字符和发音特征的混合相似度度量MixSim协助寻找匹配的实体.利用从互联网上爬取各国舰船活动事件的新闻报道和简式舰船数据进行实验,结果表明算法取得了较好的效果,而且证明了两种相似度度量在字符串比对中的有效性.
跨语言实体匹配、相似度度量、机器翻译、规则
54
TP391(计算技术、计算机技术)
湖南省自然科学基金2019JJ50726
2022-05-05(万方平台首次上网日期,不代表论文的发表时间)
共8页
12-19