基于类别分布特征的快速文本分类方法
中心和边界是类别分布的重要特征.利用训练样本类别分布特征,提出了一种基于类别分布特征的快速文本分类算法.依据类别分布特征调整文本与类别的相似度,克服了数据集类别间样本分布不均衡和类别中样本密度不均的缺点,提高分类的性能.实验结果表明,该算法提高了文本分类的效果,显示出了较好的鲁棒性,并显著提高了文本分类效率.
文本挖掘、文本分类、分布特征、快速分类、信息检索
30
TP18(自动化基础理论)
教育部科学技术重点研究项目105087
2009-04-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
1267-1269,1281