10.3969/j.issn.1002-137X.2008.07.048
二值文本分类中基于Bayes推理的特征选择方法
针对二值文本分类算法中的特征选择问题,本文提出了基于贝叶斯推理的评估函数算法来替代常用的、以IG或MI为评估函数的算法;同时,提出了以评估函数值的累计贡献率表示置信度,并以此确定特征选择维度的可量化的方法.对比实验显示,本文提出的新方法具有简便易行、高效实用的优点,此算法不仅对文本分类问题,对其它各类二值分类问题中的特征选择方法研究也都具有很好的参考、借鉴价值.
特征选择、数据挖掘、贝叶斯推理、文本分类
35
TP3;TP1
2008-10-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
173-176