DOI：10.3969/j.issn.1672-9722.2017.10.020

基于文档相似度的双语文档排序学习

引用

摘要：

论文提出了一种双语文档排序学习模型.排序是信息检索系统中重要的一个环节,学者们已经对单语言环境下的文档排序学习问题进行了很多的研究,但是多语言语境下的文档排序问题并没有得到很大的重视.在双语文档集合中,文档是用两种不同语言写成的,所以我们并不能使用已有的单语言排序学习模型直接对双语言文档进行排序.在单语言排序学习模型的基础上,提出了一种基于双语文档相似度的双语文档排序学习方法.为了能够把源语言文档和目标语言文档关联起来,提出了一种基于双语word embedding的双语文档相似度计算方法.通过简单地把源语言查询翻译为目标语言,达到筛选目标语言文档的目的.实验结果表明,该方法在英汉和英越两种语境下都取得了较好的效果.

关键词：排序学习、信息检索、文档相似度、查询翻译、双语语境

所属期刊栏目：45

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金;国家自然科学基金;云南省关键项目;创新人才计划

在线出版日期：2017-11-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：1986-1989,2017

英文信息展示

期刊专题