10.3969/j.issn.1008-0570.2006.21.104
信噪比优化算法文档分类及特征权重公式改进研究
为了提高文档分类的效率,增强信息检索的有效性,提出了一种改良的基于信噪比的文本分类方法,改进了特征权重公式,优化了文本分类.在改良后的信噪比算法中,考虑了禁用词的剔除和近义词、同义词的归类合并,解决了传统信噪比对汉语应用存在的二个问题;在改进的权重公式里,引入了特征权重在同一文档不同部位的贡献率,据此特征词的检索准确率提高.
文档分类、信噪比算法、权重公式、特征词
22
TP3(计算技术、计算机技术)
2006-09-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
294-296