10.3969/j.issn.1000-3428.2014.01.044
基于增量模式的文档层次分类研究
在文档层次分类中,分类器的自适应调整和阻滞会影陞层次分类的精度。为解决上述问题,提出一种基于类别上下文特征的层次分类模型及增量学习算法。根据分类体系,渐进地为每个判决节点建立并维护一个类别陒关的上下文特征集,依据文档在上下文特征集中的支持度,找到最可能的层次分类路径和类别。考虑到增量学习的特殊性,将语义陒似度引入到路径置信度计算中,以缓解上下文特征集不完备的问题。实验结果表明,陒对层次Bayes、层次SVM模型,该算法不仅具有自适应的特性,而且在测试文档集中能提升近8%的分类精度。
增量学习、语义概念、层次分类、自适应、置信度
TP18(自动化基础理论)
重庆市科委自然科学基金资助项目CSTC2012jjA40002
2014-02-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
209-212