基于仿射子空间稀疏表示的半监督分类
基于图的半监督分类是近年来机器学习与数据挖掘领域的研究热点之一.该类方法一般通过构造图来挖掘数据中所蕴含的本质结构,并进一步利用图的结构信息帮助对无标签样本进行分类.一般来说,基于图的半监督分类方法的效果高度依赖于其构造的图.本文提出了一种基于仿射子空间稀疏表示的图构造方法,该稀疏编码方法在最小化输入信号重构误差时考虑了3个约束条件:(1)输入信号能够被字典矩阵的仿射组合近似表示;(2)线性表示系数的非负性约束;(3)线性表示系数的稀疏性约束.根据这3个约束,我们构造了基于lo-范数的稀疏编码的约束优化问题,提出相应近似求解方法,并进而构造了数据的lo-图.最后,在正则化学习理论框架下,通过引进度量lo-图中结构保持误差的正则项,提出了一种新的半监督学习方法.该方法具有显性的多类分类函数,同时也继承了由数据稀疏编码所得lo-图中蕴含的强判别信息,因此对外样本具有快速和准确的分类能力.一系列人工数据与现实采集的数据集上的实验结果验证了所提半监督分类方法的有效性.
分类算法、数据稀疏分布、图方法、信号分类、最小二乘方法
45
TP391.41;TP181;TN912.34
国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;浙江省自然科学基金;浙江省自然科学基金;浙江省科技厅项目;北京市自然科学基金;首都经济贸易大学校级科研项目
2015-09-16(万方平台首次上网日期,不代表论文的发表时间)
985-1000