10.3969/j.issn.1006-9348.2014.07.096
一种基于向量词序的句子相似度算法研究
针对传统的句子相似度算法在句法结构等方面存在匹配率低的问题.为提高相似度计算的准确性,提出了一种改进的基于向量距离词序的句子相似度算法,从特征领域权重和词序方面进行改进,通过建立相应的领域特征集,对于相关领域的特征项给予更高的权重,同时,在向量空间模型的基础上,引入词序因子,计算句子词序相似度.使用包含6个领域的2651个句子作为语料库,实验结果表明,改进方法使特征领域内句子相似度计算的准确度得到提高.
向量空间模型、特征领域权重、词序
31
TP391(计算技术、计算机技术)
国家自然科学基金61175094
2014-09-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
419-424