10.3969/j.issn.1000-3428.2012.08.013
基于信息增益与信息熵的TFIDF算法
传统的特征词权重算法TFIDF忽略了特征词在类内、类间的分布对其权重的影响.针对该问题,引入信息熵的概念,对基于信息增益的TFIDF算法(TFIDFIG)进行改进,提出一种基于信息增益与信息熵的TFIDF算法(TFIDFIGE).实验结果表明,与传统的TFIDF算法和TFIDFIG算法相比,TFIDFIGE算法的查准率和查全率较高.
文本分类、信息增益、信息熵、TFIDF算法
38
TP391.4(计算技术、计算机技术)
中央高校基本科研业务费专项基金资助项目CDJXS 11180009
2012-06-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
37-40