DOI：10.3969/j.issn.1000-3428.2014.01.044

基于增量模式的文档层次分类研究

引用

摘要：

在文档层次分类中，分类器的自适应调整和阻滞会影陞层次分类的精度。为解决上述问题，提出一种基于类别上下文特征的层次分类模型及增量学习算法。根据分类体系，渐进地为每个判决节点建立并维护一个类别陒关的上下文特征集，依据文档在上下文特征集中的支持度，找到最可能的层次分类路径和类别。考虑到增量学习的特殊性，将语义陒似度引入到路径置信度计算中，以缓解上下文特征集不完备的问题。实验结果表明，陒对层次Bayes、层次SVM模型，该算法不仅具有自适应的特性，而且在测试文档集中能提升近8%的分类精度。

关键词：增量学习、语义概念、层次分类、自适应、置信度

分类号：TP18(自动化基础理论)

资助基金：重庆市科委自然科学基金资助项目CSTC2012jjA40002

在线出版日期：2014-02-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：209-212

英文信息展示

期刊专题