10.3969/j.issn.1673-629X.2015.05.019
一种改进的支持向量机文本分类方法
为了解决传统的支持向量机( SVM)多类分类方法中普遍存在的训练和测试时间过长、实际样本输入空间非线性可分等问题,提出了一种改进的支持向量机多类分类方法。首先,利用Mercer核函数把实际输入样本向量空间中呈非线性可分分布的样本向量映射到一个高维的特征向量空间,以实现线性可分;然后,采用二叉树来创建高维特征空间中的SVM多类分类器,实现分类识别;最后,将该方法应用到网络文本分类中。实验结果表明,该方法较好地解决了多类文本分类中实际输入文本向量呈非线性可分的问题,降低了训练和测试过程中的时间消耗,且在一定程度上提高了多类文本分类的识别准确率。
文本分类、支持向量机、二叉树、Mercer核
TP391(计算技术、计算机技术)
2012年湖北省教育科学技术研究计划指导性项目B20128103
2015-06-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
78-82