10.3321/j.issn:1002-8331.2006.28.048
海量信息搜索共享服务系统的设计与实现
如何更有效和更智能地利用网络上的资源是信息处理领域中的一项重要研究课题.文章阐述了一个海量信息搜索共享服务系统的设计与实现,该系统将相关领域的网站上的网页抓取下来,并将其提取为文本的形式,然后利用自然语言处理技术进行分词和分类.
计算机应用、网页数据抽取、分词、文本分类、向量空间模型
42
TP391(计算技术、计算机技术)
2006-11-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
164-166