10.16337/j.1004-9037.2016.02.011
基于主要特征抽取的重现概念漂移处理算法
针对重现概念漂移检测中的概念表征和分类器选择问题,提出了一种适用于含重现概念漂移的数据流分类的算法———基于主要特征抽取的概念聚类和预测算法(Conceptual clustering and predic‐tion through main feature extraction ,MFCCP)。MFCCP通过计算不同批次样本的主要特征及影响因子的差异度以识别重复出现的概念,为每个概念维持且及时更新一个分类器,并依据Hoeffding不等式选择最合适的分类器对当前样本集实施分类,以提高对概念漂移的反应能力。在3个数据集上的实验表明:M FCCP在含重现概念漂移的数据集上的分类准确率,对概念漂移的反应能力及对概念漂移检测的准确率均明显优于其他4种对比算法,且M FCCP也适用于对不含重现概念漂移的数据流进行分类。
重现概念漂移、主要特征、影响因子、数据流、Hoeffding不等式
31
TP181(自动化基础理论)
国家自然科学基金61363029,61540053资助项目;广西区科学研究与技术开发桂科攻14124005-2-1资助项目;湖南省博士后科研专项资助计划2011RS4073资助项目;广西信息科学中心YB408资助项目。
2016-05-20(万方平台首次上网日期,不代表论文的发表时间)
共10页
315-324