10.3969/j.issn.1002-137X.2004.12.040
一种无需语句分割的中文文档自动分类方法研究及实现
目前,对于外文文档的自劝分类,已有许多有效的方法.但是,中文的特殊性使得这些方法对于中文文档不是很有效.本文提出了一种比较简单的中文文档的自动分类方法,即不用语句分割,只需要计算出文档中各个单字出现的频率,对照已经训练过的模版,就可以比较准确地对其分类.
中文文档分类、Apriori性质、语句分割、N-Gram、词素解析
31
TP3;TN9
2005-01-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
137-138,158