10.3969/j.issn.2095-2783.2011.07.007
基于局部稀疏K近邻密度的主动学习
在选择含信息量大的样本时,基于不确定度缩减的主动学习算法通常会将孤立点一并加入训练集,从而影响分类效果。为此,提出一种基于局部稀疏K近邻密度的主动学习算法,采用近邻密度来判定未标记样本是否为孤立点,并考虑未标记样本周边样本的稀疏程度,减少将非均匀分布样本集中的孤立点当作正常样本点及将正常样本点当作孤立点的错误。典型UCI和人工数据集上的仿真结果表明,与基于密度重排序的主动学习算法相比,所提算法能够取得较好的分类性能。
主动学习、信息熵、孤立点、K近邻密度
6
TP18(自动化基础理论)
高等学校博士学科点专项科研基金资助项目200802901506;霍英东教育基金会青年教师基金资助项目121066
2011-12-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
507-511