一种多义词词向量计算方法
语义相似度计算在自然语言处理领域有着非常重要的作用,近年来随着深度学习技术的兴起,利用词向量的进行语义相似度计算的技术得到广泛应用.人们提出了许多计算词向量的模型和方法,但这些模型中一个词仅对应一个词向量,而自然语言中存在着大量的多义词,因此这些模型不能很好的表示多义词语义特征.本文提出一种多义词词向量计算方法,引入主题模型对多义词进行语义标注,将标注后的词语视为新词进行词向量计算,可得到一个多义词的多个词向量.在中英文两种语料上进行了实验,实验结果表明,该方法能准确计算出多义词不同含义的词向量,语义相似度计算的准确性明显提高.
词向量、多义词、主题模型、语义相似度
37
TP311(计算技术、计算机技术)
数学工程与先进计算国家重点实验室开放基金面上项目2013A02
2016-10-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
1417-1421