10.11896/j.issn.1002-137X.2017.09.048
基于Word2vec的句子语义相似度计算研究
word2vec利用深度学习的思想,可以从大规模的文本数据中自动学习数据的本质信息.因此,借助哈尔滨工业大学的LTP平台,设计利用word2vec模型将对句子的处理简化为向量空间中的向量运算,采用向量空间上的相似度表示句子语义上的相似度.此外,将句子的结构信息添加到句子相似度计算中,并就特殊句式对算法进行了改进,同时考虑到了词汇之间的句法关系.实验结果表明,该方法更准确地揭示了句子之间的语义关系,句法结构的提取和算法的改进解决了复杂句式的相似度计算问题,提高了相似度计算的准确率.
句子相似度、word2vec、词向量、语义、句法结构
44
TP391.1(计算技术、计算机技术)
国家自然科学基金:面向甲骨学知识图谱的实体发现及语义关系挖掘研究U1504612;河南省高等学校重点科研项目计划:基于语义向量空间模型的中文文本相似度计算研究16A520037
2017-10-20(万方平台首次上网日期,不代表论文的发表时间)
共5页
256-260