10.3969/j.issn.1673-629X.2014.05.016
用KPCA-SVM的方法检测垃圾标签的研究
高维数据中进行各种处理时所需样本数量会成指数级增加,同时样本间距离的价值也逐渐减小,将导致维数灾问题。文本标签数据通常会面临数据维数过高的问题,会影响用户对垃圾标签的检测。文中借助支持向量机的数学模型构建出针对Folksonomy的大规模垃圾标签检测模型。为了减少检测垃圾标签时维数过高的影响,在核主成分分析理论的启发下,将数据降维思想引入数据约简领域,提出基于核主成分分析法的大规模SVM数据集约简模型。最终实例化形成一种新的垃圾标签检测方法,即基于核主成分分析支持向量机( KPCA-SVM)的大规模垃圾标签检测模型。该模型在垃圾标签检测中可以在不影响数据特征的前提下,缩短模型的测试时间且检测性能良好。
数据降维、核主成分分析法、支持向量机、垃圾标签
TP301(计算技术、计算机技术)
教育部人文社会科学研究项目11YJAZH080
2014-05-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
65-69