10.3969/j.issn.1004-373X.2007.10.031
一种基于PCA和RS的文本特征抽取方法
提出一种基于PCA(主成分分析)和RS(粗糙集)的文本特征抽取方法.首先利用PCA将n维词语特征-文档矩阵变换为一个m维的正交矩阵,再采用RS的方法时m维新特征进行进一步的约简.实验结果表明,新的特征抽取方法用于垃圾邮件过滤能有效的提高垃圾邮件过滤的正确率和召回率.
PCA、RS、特征抽取、特征约简
30
TP311(计算技术、计算机技术)
2007-06-25(万方平台首次上网日期,不代表论文的发表时间)
共3页
88-90