10.3778/j.issn.1002-8331.2011.07.041
一种大容量文本集的智能检索方法
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略.检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成.使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号.实验结果证明了这种方法的有效性和高效性.
向量空间模型、潜在语义索引、奇异值分解、文本信息检索
47
TP391.1(计算技术、计算机技术)
吉林省科技发展计划国际合作项目20050703-1
2011-06-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
143-145,158