10.16451/j.cnki.issn1003-6059.201807006
基于向量表示和标签传播的半监督短文本数据流分类算法
社交网络平台产生海量的短文本数据流,具有快速、海量、概念漂移、文本长度短小、类标签大量缺失等特点.为此,文中提出基于向量表示和标签传播的半监督短文本数据流分类算法,可对仅含少量有标记数据的数据集进行有效分类.同时,为了适应概念漂移,提出基于聚类簇的概念漂移检测算法.在实际短文本数据流上的实验表明,相比半监督分类算法和半监督数据流分类算法,文中算法不仅提高分类精度和宏平均,还能快速适应数据流中的概念漂移.
短文本数据流、半监督分类、标签传播、概念漂移
31
TP391.1(计算技术、计算机技术)
国家重点研发计划项目2016YFC0801406;国家自然科学基金项目61503112,61673152
2018-09-05(万方平台首次上网日期,不代表论文的发表时间)
共9页
634-642