10.3969/j.issn.1000-3428.2006.20.034
特征序列分析方法在文本分类中的应用
把计算生物学中DNA序列分析的一种方法应用到文本分类中,通过分析文档集所产生的可描述类别内在特征的特征序列,给出了一种文本分类方法SSAM,并在Reuters21578数据集上和其它几种常见分类方法的分类效果进行了比较,实验结果显示SSAM的分类效果优于传统的贝叶斯方法,而且具有较快的分类速度.
文本分类、向量空间模型、特征序列
32
TP311(计算技术、计算机技术)
2006-11-23(万方平台首次上网日期,不代表论文的发表时间)
共3页
92-94