DOI：10.3969/j.issn.1673-629X.2014.05.016

用KPCA-SVM的方法检测垃圾标签的研究

引用

摘要：

高维数据中进行各种处理时所需样本数量会成指数级增加，同时样本间距离的价值也逐渐减小，将导致维数灾问题。文本标签数据通常会面临数据维数过高的问题，会影响用户对垃圾标签的检测。文中借助支持向量机的数学模型构建出针对Folksonomy的大规模垃圾标签检测模型。为了减少检测垃圾标签时维数过高的影响，在核主成分分析理论的启发下，将数据降维思想引入数据约简领域，提出基于核主成分分析法的大规模SVM数据集约简模型。最终实例化形成一种新的垃圾标签检测方法，即基于核主成分分析支持向量机( KPCA-SVM)的大规模垃圾标签检测模型。该模型在垃圾标签检测中可以在不影响数据特征的前提下，缩短模型的测试时间且检测性能良好。

关键词：数据降维、核主成分分析法、支持向量机、垃圾标签

分类号：TP301(计算技术、计算机技术)

资助基金：教育部人文社会科学研究项目11YJAZH080

在线出版日期：2014-05-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：65-69

英文信息展示

期刊专题