基于谷歌翻译及Doc2vec的中英句子相似度计算
句子相似度计算在统计机器翻译、基于实例的机器翻译与语料对齐领域有着巨大的研究价值.本文借助于谷歌翻译作为媒介,针对由Word2vec改进而来的表示句子向量的方法——Doc2vec模型,对中英句子相似度计算进行了研究.分别利用谷歌翻译将中文译文进行中文句向量训练及计算与英文译文的英文句向量训练及计算对比分析.实验结果表明,基于Doc2vec的方法在计算句子相似度方面,无论是中文句向量还是英文句向量,其作为句向量表达句子含义的准确性都还有待商榷.
Doc2vec、谷歌翻译、句子相似度计算、双语句对齐
15
TP391(计算技术、计算机技术)
2019-06-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
224-227