10.3969/j.issn.1002-7378.2010.04.015
基于多质心的不良文本快速过滤方法
针对Rocchio容易受到类别样本分布及噪声影响的而导致错误扩大类别范围的问题,提出对训练样本进行聚类,使用聚类形成的多个簇的质心向量替代单个质心向量作为过滤判定向量组的方法.该方法既能保证过滤效率,又比单质心的Rocchio过滤法具有更高的召回率和准确率.
不良文本、快速过滤、多质心向量、Rocchio、K-means
26
TP391.3(计算技术、计算机技术)
2011-03-11(万方平台首次上网日期,不代表论文的发表时间)
共3页
436-438