10.3778/j.issn.1673-9418.1705027
大规模核方法的随机假设空间方法
大规模核方法是大规模数据分析与挖掘的基本机器学习方法.核方法在再生核希尔伯特空间中训练线性学习器求解样本空间中的非线性问题,求解时间复杂度关于数据规模是平方级的,预测也依赖于整个训练数据,因而不适用于大规模学习问题.针对这些问题,提出了大规模核方法的有效随机假设空间方法.首先,在关于样本维度对数时间复杂度内,应用循环随机特征映射显式构造假设空间,该空间称之为循环随机假设空间.然后,在循环随机假设空间中应用线性或亚线性学习算法训练线性模型.理论上,给出了循环随机假设空间的一致泛化误差上界及其相对于最优泛化误差的收敛性.实验结果表明,大规模核方法的随机假设空间方法不仅能够显著地提高非线性核方法的训练与预测效率,而且能够保持与非线性核方法相当的预测精度.该方法有理论保障,计算复杂度低,运行效率高,是当前最高效的大规模核方法实现方法.
核方法、循环随机特征映射、随机假设空间、线性学习算法、大规模核方法
12
TP181;TP301(自动化基础理论)
The National Natural Science Foundation of China under Grant No.61673293
2018-06-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
785-793