10.3969/j.issn.1000-3428.2008.23.033
中文文本体裁分类中特征选择的研究
针对文本体裁自动分类在特征选择和权重计算方面的特殊性,提出文本的内容类别信息,改进传统特征选择方法CHI以及权重计算公式tf.idf,并运用支持向量机在含5类体裁的语料上进行中文文本体裁自动分类.实验结果表明,该方案是可行的.
中文信息处理、体裁分类、特征项选择、支持向量机
34
TP311.5(计算技术、计算机技术)
国家自然科学基金资助项目60564001
2009-02-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
89-91