10.3969/j.issn.1000-3428.2011.08.016
基于归一化向量的文本分类算法
基于归一化思想和矩阵投影运算提出一种文本分类算法.该算法综合考虑单个类别内的文档频率和词频,用于进行矩阵投影运算.将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化的特征向量,可有效地达到降低特征空间维数、提高分类效率和精度的目的.与kNN算法的对比实验表明,该算法在时间性能和精度上都有较大提高.
文本分类、矩阵投影、向量空间模型、归一化向量
37
TP18(自动化基础理论)
国家科技支撑计划基金资助项目2008BAH37B04;重庆市自然科学基金资助重点项目CSTC2008BB2195
2011-08-05(万方平台首次上网日期,不代表论文的发表时间)
共3页
47-49