几种降维技术在分类问题中的效果评估
高维数据将会给数据分析带来极大的困难,因其所导致的数据分布稀疏化和数据组织效果的下降将会大大影响模型的性能.降维就是用于解决"维度灾难"的方法之一.文章从PCA、LLE、Isomap三种常见的降维方法入手,首先介绍了它们的实现原理,进一步结合KNN、SVM、RandomForest、Naive Bayes以及Logistics Regression模型构建了用于评价三种降维方法的综合交叉模型.结果表明,在文章所使用的数据集中,经过PCA方法与Isomap方法降维后的数据在可视的2维空间上分布较为均匀,而LLE方法分布则较为集中.且使用了PCA与Isomap方法的分类模型训练后的平均准确率高达96.44%与96.90%,高于LLE方法处理后所得的90.74%,PCA与Isomap具有较优的降维效果.本研究中所采用的方法与所得的结果为降维方法的选择提供了有益的参考.
降维、PCA、LLE、Isomap、效果评估
TP311.13(计算技术、计算机技术)
2018-07-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
22-23,26