10.3969/j.issn.1000-1220.2004.12.045
TFIDF_NB协同训练算法
采用少量已标记和大量未标记文档进行文本分类已成为一种重要研究趋势.在分析了EM和联合训练 (Co-training)两类算法的基础上,提出一种新的协同训练算法.该算法利用Bayes和TFIDF两种分类器结合少量已标记和大量未标记文档协同增量训练.实验结果表明,协同训练算法正确率较高,平均错误率较EM和联合训练低,具有较好的性能.
文本分类、半监督算法、联合训练算法、EM算法、协同增量训练
25
TP181(自动化基础理论)
中国科学院资助项目60272051
2005-01-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
2243-2246