10.3969/j.issn.0490-6756.2019.01.013
最大判别特征选择算法在文本分类的优化研究
采用朴素贝叶斯分类器进行文本分类时,特征选择方法的好坏直接影响到分类器的性能.本文提出一种最大判别(MD)特征选择算法,由训练得到N个类的概率分布后,通过对样本进行测试并得到其特征向量d中每个特征词区分类别的能力,并构造出了一个新的特征向量ε用于分类,使得从中选取的部分特征词具有最大的类别区分能力.仿真结果表明,与cMFD,CSFS和CMFS三种特征选择算法相比,MD特征选择算法能在选取较少特征词情况下,获得更高的分类精度.
相对熵、杰弗里斯散度、多项式朴素贝叶斯分类器、特征选择
56
TN929.5
国家自然科学基金61262040
2019-05-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
65-70