10.3969/j.issn.1000-3428.2002.08.056
Web挖掘系统的设计与实现
介绍了Web挖掘理论,包括Web挖掘定义、Web挖掘任务、Web挖掘分类3个方面,并简单介绍了实现Web文本挖掘系统WTMiner(WebTextMiner)的几个关键技术:分词,特征提取,分类器的设计.在分词中采用了支持首字Hash和二分查找从而提高了分词速度,分类器的设计中考虑到SVM的训练算法速度慢的缺点,用近邻法以减少训练样本集中样本的数量,从而大大提高了算法速度.
Web挖掘、文本分类、支持向量机(SVM)、分词
28
TP391;TP393(计算技术、计算机技术)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
141-142,151