基于文本聚类与分布式Lucene的知识检索
针对传统集中式索引处理大规模数据的性能和效率问题,提出了一种基于文本聚类的检索算法.利用文本聚类算法改进现有的索引划分方案,根据查询与聚类结果的距离计算判断查询意图,缩减查询范围.实验结果表明,所提方案能够有效地缓解大规模数据建索引和检索的压力,大幅提高分布式检索性能,同时保持着较高的准确率和查全率.
非结构化知识、分布式索引、文本聚类、全文检索、并行检索
33
TP391.3(计算技术、计算机技术)
2013-02-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
186-188