10.3969/j.issn.1003-0077.2002.05.004
智能Web中文主题信息收集系统IRobot的设计
本文介绍了智能Web中文主题信息收集系统IRobot的设计思想和方法.针对Web主题信息收集所具有的许多新特性,系统采用了对待收集URL进行相关度预测为主,对已收集页面进行相关度评价结合的收集机制.尤其在URL的相关度预测中,深入考虑了Web主题信息结构和组织特性的多种因素,综合提高了系统的性能.相比已有的研究,系统的精度和收集效率更高,且更为稳定,并能够自动获得主题领域内重要资源的列表.
信息检索、主题信息收集、相关度预测、相关度评价、中文信息处理
16
TP391.3(计算技术、计算机技术)
2004-03-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
23-29