10.3969/j.issn.1002-1965.2009.06.036
基于后缀树的西文二次文献相关性算法设计
基于后缀树结构与向量空间模型来设计西文二次文献的文献相关性判定算法.给出了文献相关性判定的流程,分析了后缀树算法的优势,并采用后缀树算法抽取特征项建立向量空间模型.与基于词的向量空间模型相比,基于后缀树的文献相关性判定算法在理论上有利于降低向量空间的维数,避免产生高维问题,并且基于后缀树模型的文献相关性算法独立于语言种类.
后缀树、文本表示、文献相关性、特征项
28
N99;N289(情报学、情报工作)
2009-07-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
155-158