10.16451/j.cnki.issn1003-6059.202009006
基于最大决策边界的高维类不平衡数据在线流特征选择
数据的特征空间常随时间动态变化,而训练样本的数量固定不变,数据的特征空间在呈现超高维特点的同时通常伴随决策空间的类别不平衡问题.对此,文中提出基于最大决策边界的高维类不平衡数据在线流特征选择算法.借助邻域粗糙集模型,在充分考虑边界样本影响的基础上,定义自适应邻域关系,设计基于最大决策边界的粗糙依赖度计算公式.同时,提出三种在线特征子集评估指标,用于选择在大类和小类之间具有强区分能力的特征.在11个高维类不平衡数据集上的实验表明,在相同的实验环境及特征数量下,文中算法综合性能较优.
在线特征选择、高维类不平衡数据、自适应邻域、邻域粗糙集
33
TP18(自动化基础理论)
国家自然科学基金项目;福建省自然科学基金项目;福建省教育厅科技项目
2020-11-10(万方平台首次上网日期,不代表论文的发表时间)
共10页
820-829