10.3778/j.issn.1673-9418.2011.09.006
基于类标签聚类的动态问题分类集成学习算法
问题分类是问答社区系统的关键技术,分析用户提出的自然语言问题,并返回一个确切而适当的问题类别.针对网络社区中问题分类标签众多(>1 000)、有一定层次且易受时间演化影响的问题,提出了针对两种不同流动粒度的问题分类算法,运用不同时刻的数据集层次集成学习方法提高了问题分类精度和效率.同时,针对单次分类标签过多引起的特征集混淆问题,将已有层次的分类标签树基于基分类器错误率和混淆矩阵进行聚类,进一步提高了问题分类的精度和效率.
问题分类、概念漂移、类标签聚类
5
TP311(计算技术、计算机技术)
The Fundamental Research Funds for the Central Universities of China;the Research Funds of Renmin University of China under Grant No.10XNJ031,10XNI018
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共9页
826-834