10.3778/j.issn.1002-8331.1207-0116
基于LASVM-NC和TF.RF的文本分类方法
非凸在线支持向量机(LASVM-NC)具有抗噪能力强和训练速度快的优点,而词频相关频率积(tf.rf)则是一种自适应能力很强、分类性能非常好的文本特征。通过把非凸在线支持向量机和词频相关频率积相结合,提出了一种新的文本分类方法,即LASVM-NC+tf.rf。实验结果表明,这种方法在LASVM-NC与多种其他特征的结合中性能是最好的,且与SVM+tf.rf相比,不仅所产生的分类器具有泛化能力更强、模型表达更稀疏的优点,而且在处理含噪声的数据时具有更好的鲁棒性,在处理大规模数据时具有快得多的训练速度。
非凸在线支持向量机、支持向量机、特征项、词频、相关频率、文本分类
TP311(计算技术、计算机技术)
国家自然科学基金No.61175004,No.60775010;北京市自然科学基金No.4112009;北京市教委科技发展项目No.KZ201210005007;高等学校博士学科点专项科研基金No.20121103110029。
2014-06-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
136-140,265