基于数据融合的组合特征提取方法的研究
针对Web文本的特征提取方法多种多样,但均存在各自的不足且对数据集偏斜问题普遍没有很好的解决能力,针对该问题采用BNS特征提取算法和Odds特征提取算法基于数据融合思想进行Web文本特征提取并用支持向量机进行分类.在保持BNS算法对于数据集偏斜问题的解决能力的基础上用Odds算法提高BNS算法的精确度.实验结果表明,用数据融合思想将这两种方法结合可以有效弥补两种方法各自的不足,并能提高分类准确率.
特征提取、数据集偏斜、数据融合、支持向量机、Web文本分类
30
TP391.4(计算技术、计算机技术)
2009-06-12(万方平台首次上网日期,不代表论文的发表时间)
共4页
2529-2532