10.3969/j.issn.1006-9348.2007.03.075
中文文本分类中的特征选择研究
有多种特征选择算法被用于文本自动分类,YimingYang教授曾针对英文文本分类中的特征选择做过深入的研究,并得出结论:IG和CHI方法效果相对较好.考虑到该结论不一定适合对中文文本的分类,对中文文本分类中的特征选择方法进行研究,采用了包含500篇新闻的中文语料库对几种特征选择算法进行测试,结果表明:在测试的特征选择算法中,χ2估计方法无需因训练集的改变而人为调节特征阀值,并且分类准确率较高.
特征选择、特征提取、文本分类
24
TP18(自动化基础理论)
2007-04-23(万方平台首次上网日期,不代表论文的发表时间)
共3页
289-291