10.3969/j.issn.1000-3428.2006.19.028
基于文本分类TFIDF方法的改进与应用
TFIDF是文档特征权值表示常用方法.该方法简单易行,但低估了在一个类中频繁出现的词条,该词条是能够代表这个类的文本特征的,应该赋予其较高的权重.通过修改TFIDF中IDF的表达式,来增加那些在一个类中频繁出现的词条的权重,用改进的TFIDF选择特征词条、用遗传算法训练分类器来验证其有效性.该方法优于其它算法,实验表明了改进的策略是可行的.
文本分类、特征选择、THDF、类别区分
32
TP393(计算技术、计算机技术)
2006-11-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
76-78