10.11896/j.issn.1002-137X.2019.01.010
概念漂移数据流分类中的多源在线迁移学习算法
现有概念漂移处理算法在检测到概念漂移发生后,通常需要在新到概念上重新训练分类器,同时"遗忘"以往训练的分类器.在概念漂移发生初期,由于能够获取到的属于新到概念的样本较少,导致新建的分类器在短时间内无法得到充分训练,分类性能通常较差.进一步,现有的基于在线迁移学习的数据流分类算法仅能使用单个分类器的知识辅助新到概念进行学习,在历史概念与新到概念相似性较差时,分类模型的分类准确率不理想.针对以上问题,文中提出一种能够利用多个历史分类器知识的数据流分类算法——CMOL.CMOL算法采取分类器权重动态调节机制,根据分类器的权重对分类器池进行更新,使得分类器池能够尽可能地包含更多的概念.实验表明,相较于其他相关算法,CMOL算法能够在概念漂移发生时更快地适应新到概念,显示出更高的分类准确率.
多源迁移学习、在线学习、概念漂移、数据流分类
46
TP391(计算技术、计算机技术)
国家自然科学基金61363029,61866007;广西区自然科学基金2018GXNSFDA138006;广西可信软件重点实验室立项资助课题KX201721;广西高校图像图形智能处理重点实验室课题资助项目GIIP201505;广西云计算与大数据协同创新中心项目YD16E12
2019-03-15(万方平台首次上网日期,不代表论文的发表时间)
共9页
64-72