DOI：10.3969/j.issn.1673-629X.2012.05.021

一种新的中文文本分类算法——One Class SVM-KNN算法

引用

摘要：

中文文本分类在数据库及搜索引擎中得到广泛的应用,K-近邻(KNN)算法是常用于中文文本分类中的分类方法,但K-近邻在分类过程中需要存储所有的训练样本,并且直到待测样本需要分类时才建立分类,而且还存在类倾斜现象以及存储和计算的开销大等缺陷.单类SVM对只有一类的分类问题具有很好的效果,但不适用于多类分类问题,因此针对KNN存在的缺陷及单类SVM的特点提出One Class SVM-KNN算法,并给出了算法的定义及详细分析.通过实验证明此方法很好地克服了KNN算法的缺陷,并且查全率、查准率明显优于K-近邻算法.

关键词：中文文本分类、支持向量机、K-近邻、One Class SVM-KNN

所属期刊栏目：22

分类号：TP301.6(计算技术、计算机技术)

在线出版日期：2012-07-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：83-86

英文信息展示

期刊专题