10.3969/j.issn.1000-3428.2012.01.062
基于特征选择的质心向量构建方法
基于质心的文本分类方法对模型较敏感,分类性能较差.为此,提出一种基于特征选择的类别质心向量构建方法FSCC.计算特征与类别之间的特征选择值,利用质心特征权重计算公式得到类别的质心向量,并采用非归一化的余弦相似度计算文档与质心间的距离,实现文本分类.实验结果表明,与基于质心的方法和支持向量机方法相比,FSCC方法的分类效果更好.
特征选择、特征权重、余弦相似度、质心、文本分类
38
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60673039,60973068;国家"863"计划基金资助项目2006AA01Z151;高等学校博士学科点专项科研基金资助项目20090041110002
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
195-196,210