10.3969/j.issn.1673-629X.2012.05.021
一种新的中文文本分类算法——One Class SVM-KNN算法
中文文本分类在数据库及搜索引擎中得到广泛的应用,K-近邻(KNN)算法是常用于中文文本分类中的分类方法,但K-近邻在分类过程中需要存储所有的训练样本,并且直到待测样本需要分类时才建立分类,而且还存在类倾斜现象以及存储和计算的开销大等缺陷.单类SVM对只有一类的分类问题具有很好的效果,但不适用于多类分类问题,因此针对KNN存在的缺陷及单类SVM的特点提出One Class SVM-KNN算法,并给出了算法的定义及详细分析.通过实验证明此方法很好地克服了KNN算法的缺陷,并且查全率、查准率明显优于K-近邻算法.
中文文本分类、支持向量机、K-近邻、One Class SVM-KNN
22
TP301.6(计算技术、计算机技术)
2012-07-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
83-86