10.3969/j.issn.1001-6600.2007.04.052
一种组合型中文文本分类特征选择方法
根据基于频数分布和基于互信息的特征选择模式的特点,将传统的tf-idf因子以及基于互信息的特征选择方法分别进行了改进,并在此基础上提出了一种新的组合型特征选择方法.试验结果表明,该算法提高了文本分类的准确率.
特征选择、文本分类、特征权重、互信息
25
TP391(计算技术、计算机技术)
国家自然科学基金70571087
2007-12-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
208-211