10.3969/j.issn.1000-0135.2008.02.012
基于岭回归和支持向量机结合的数据挖掘新方法
支持向量机根据VC 维理论和结构风险最小化原则,是一种建立在统计学习理论基础之上具有新颖、功能强大特点的机器学习方法.它具有全局最优、结构简单、推广能力强等优点,近年来越来越引起关注.但支持向量机是一种小样本机器学习方法,自身的复杂性和多重共线性成为其处理大规模数据时的"瓶颈"问题.岭回归方法是一种修正的最小二乘估计法,是一种专门用于复共线性数据分析的有偏估计方法,当自变量系统中存在多重相关性时,它可以提供一个比最小二乘法更为稳定的估计.本文将岭回归-支持向量机结合,用于数据挖掘方法之一--文本分类中,实验结果表明:本方法可以提高支持向量机分类的训练速度和分类精度.
岭回归、支持向量机、数据挖掘、文本分类
27
G35(情报学、情报工作)
2008-05-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
229-234