针对标签噪声数据的自步半监督降维

引用

摘要：

数据类别标记是一项费时费力的工作,且标记质量会直接影响模型预测性能.基于自步学习机制构建自步半监督降维框架,将由简单到复杂的样本逐步纳入模型训练过程.在此框架下,设计自步半监督降维算法,依据交替优化策略,在更新降维映射函数与计算样本重要度之间交替迭代.一方面,最小化低维标签数据的加权类内分散程度,且考虑再生核希尔伯特空间中的函数复杂度正则化项与数据稀疏结构图上的光滑度正则化项,得到降维映射.另一方面,依据自步学习机制,计算标签数据的低维表示与其所在类的锚点之间的距离,给定下次迭代时样本的重要度.所提框架及算法对标签噪声具有较好的鲁棒性,能自适应给出标签样本的重要度及显性非线性的降维映射,所得的低维表示具有较强的可分性与判别性.在5个实验数据集上,对于标签具有噪声的数据,所提算法获得的低维表示的最近邻分类准确率分别比次优算法最多提高了2.2、5.6、5.0、11.3、2.7个百分点,验证了所提算法的有效性和鲁棒性.

关键词：半监督降维、自步学习、映射、稀疏表示、特征提取

所属期刊栏目：49

分类号：TP18(自动化基础理论)

资助基金：首都经济贸易大学北京市属高校基本科研业务费专项QNTD202109

在线出版日期：2023-11-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：131-142

英文信息展示

期刊专题