10.3969/j.issn.1000-3428.2010.22.066
基于关联分析的文本分类特征选择算法
提出一种在选取特征时考虑特征与特征之间联系的算法.对特征词之间的关联关系进行挖掘,找出那些对类别有重要影响的特征词组,而这些特征词组中的每个单词在传统单独打分策略的特征选择算法中很可能会因分值过低而被丢弃.在Ruters21578、20Newsgroup文本数据集上进行实验,将算法与广泛应用的特征选择算法(信息增益、CHI 等)进行对比、分析.实验结果表明该方法是一种有特点、有效的特征选择方法.
特征选择、交叉熵、文本分类、关联挖掘
36
TP391(计算技术、计算机技术)
2011-01-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
184-186