DOI：10.3772/j.issn.1000-0135.2009.02.012

Web自动文本分类技术研究综述

引用

摘要：

Web自动文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.本文首先分析了国内外Web自动文本分类方法的研究现状,接着对新近出现的多分类器融合的方法、基于群的分类方法、基于RBF网络的文本分类模型、基于模糊-粗糙集的文本分类模型、潜在语义分类模型等新方法,以及K-近邻算法和支持向量机的新发展等进行了深入探讨;并对Web自动文本分类过程中的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法等进行了分析;最后总结了当前Web自动文本分类技术存在的问题及其发展趋势.

关键词：文本分类、分类方法、文本表示、特征选择

所属期刊栏目：28

分类号：TP3;TP1

在线出版日期：2009-05-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：233-241

英文信息展示

期刊专题