基于改进KNFL算法的海量文本分类研究
KNFL算法是近年来在人脸识别领域提出并广泛应用的分类算法,它认为类空间中两点的连线可以比类内的点更能代表类空间的特征.如果仅依据特征线距离来分类,会造成误分.这里为消除类内离群点对分类的影响提出引入加权系数,并结合类中心距的概念提出改进算法,并将其应用到海量文本分类中去.试验结果证明此改进算法能够提高文本分类精度,很好的降低了分类器对训练规模的要求.
K最近特征线、离群点、类中心距
TP391(计算技术、计算机技术)
河南省教育厅科研项目sp200303099
2005-11-24(万方平台首次上网日期,不代表论文的发表时间)
共3页
159-160,163