10.3969/j.issn1672-9722.2013.10.011
基于Tri-Training算法的数据编辑技术
Tri Training是一种半监督学习算法,在少量标记数据下,通过三个不同的分类器,从未标记样本中采样并标记新的训练数据,作为各分类器训练数据的有效补充.但由于错误标记样本的存在,引入了嗓音数据,降低了分类的性能.论文在Tri-Training算法中分别采用DE-KNN,DE-BKNN和DE-NED三种数据编辑技术,识别移除误标记的数据.通过对六组UCI数据集的实验,分析结果表明,编辑技术的引入是有效的,三种方法的使用在一定程度上提升了Tri-Training算法的分类性能,尤其是DE-NED方法更为显著.
半监督学习、Tri-Training算法、数据编辑
41
TP391(计算技术、计算机技术)
云南省教育厅科研基金项目2012C098
2013-11-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
1583-1585