10.3969/j.issn.1000-3428.2011.05.071
一种改进的特征权重算法
特征权重算法对文本分类系统的精确度有很大影响,传统的TFIDF算法未能考虑特征项在类间和类内的分布情况.为此,在对传统算法和相关改进算法进行分析的基础上,引入类间偏斜度、类内离散度和权重调整因子的改进思路,提出一种基于WA-DI-SI的特征权重改进算法,分别采用支持向量机和朴素贝叶斯2种分类算法进行测试.测试结果表明,与其他改进算法相比,该算法能够获得更好的分类效果.
文本分类、特征权重、类间偏斜度、类内离散度、权重调整因子
37
TP311.52(计算技术、计算机技术)
河南省创新型科技团队建设基金资助项目094200510009
2011-05-04(万方平台首次上网日期,不代表论文的发表时间)
共3页
210-212