DOI：10.3969/j.issn.1000-3428.2014.05.038

基于特征变换的Tri-Training算法

引用

摘要：

提出一种基于特征变换的Tri-Training算法。通过特征变换将已标记实例集映射到新空间，得到有差异的训练集，从而构建准确又存在差异的基分类器，避免自助采样不能充分利用全部已标记实例集的问题。为充分利用数据类分布信息，设计基于Must-link和Cannot-link约束集合的特征变换方法(TMC)，并将其用于基于特征变换的Tri-Training算法中。在UCI数据集上的实验结果表明，在不同未标记率下，与经典的Co-Training、Tri-Trainng算法相比，基于特征变换的Tri-Training算法可在多数数据集上得到更高的准确率。此外，与Tri-LDA和Tri-CP算法相比，基于TMC的Tri-Training算法具有更好的泛化性能。

关键词：特征变换、已标记实例集、差异、自助抽样、泛化能力

分类号：TP18(自动化基础理论)

在线出版日期：2014-06-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：183-187,191

英文信息展示

期刊专题