10.3321/j.issn:1671-5489.2009.02.030
基于改进后缀树算法中英文聚类引擎的实现
提出一种基于改进后缀树与交互聚类思想相结合的算法ISTC算法,通过改造传统后缀树结构实现了对文档标题和摘要的层次化聚类,同时用交互聚类的方式替代了传统的递归算法. ISTC算法具有语言无关性,不仅适用于基于单词的西方文字,而且可以在不引入词典分词技术的情况下有效地处理基于单字的中文字符. 在此算法基础上,设计并实现了基于改进后缀树算法的交互聚类引擎,在不同的网络环境下对其进行了系统测试,并与其他元搜索引擎进行了对比. 实验结果表明,使用改进后缀树算法进行实时交互式聚类是可行的.
后缀树、文本聚类、元搜索引擎
47
TP31(计算技术、计算机技术)
吉林省科技发展计划项目基金20070533
2009-05-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
299-304