10.3969/j.issn.1001-3695.2011.06.026
用双层减样法优化大规模SVM垃圾标签检测模型
针对支持向量机在训练大规模数据集时出现的速度瓶颈问题,提出一种新的减样方法,称为双层减样法.数据减样时,双层减样法从粗、细粒度两个层次削减样本.粗粒度约减时,利用核空间距离聚类法,以簇为单位削减冗余子集;细粒度约减时,以点为单位挑选剩余点集中的支持向量.实验表明,双层减样法能有效地压缩样本数据,同时还能放大数据集的分类特征,提高分类器的分类精度.将此法应用于大规模SVM垃圾标签检测模型的训练集优化上,能明显提高检测模型的训练速度.双层减样法将粒度和层次的概念引入减样法中,在约减时适时改变约减幅度,这比传统减样法更具有优势.
Folksonomy、垃圾标签、支持向量机、双层减样法、约减
28
TP181(自动化基础理论)
广西工学院自然科学基金资助项目院科自1074011
2011-09-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
2095-2098