10.3969/j.issn.1000-7024.2007.23.070
基于TFIDF的特征选择方法
在文本分类系统中,特征选择方法是一种有效的降维方法.在分析了几种常用的特征选择评价函数之后,将权值计算函数应用于特征选择,并基于改进的TFIDF方法提出了一种新的评价函数,它将类别信息引入到特征项中,提取出与类别相关的特征项,弥补了TFIDF的缺陷.实验证明该方法简单可行,有助于提高所选特征子集的有效性.
特征选择、术语频率、逆文档频率、文本分类、评价函数
28
TP391(计算技术、计算机技术)
山东省自然科学基金Y2006G20
2008-04-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
5795-5796,5799