10.3969/j.issn.1004-373X.2012.21.029
基于SVM的快速中文组块分析方法
基于结构风险最小化的SVM(支持向量机)统计学习理论随着样本数量的增加,不仅训练模型的时间开销会非线性地增长,而且分类的时间开销也会随着支持向量个数的增加而增大.为了使语言分析模型涵盖足够的语言现象并能快速完成模型训练和句子分析,采用了先将组块识别看成文本切分的二分类问题的办法,通过SVM对语料中不同类别词语分别建模,再从组块的构成知识进一步判定组块类型.实验结果表明,这种方法的分析速度和准确率都有一定的提高.
中文信息处理、组块识别、组块特征、支持向量机
35
TN911.7-34
2013-01-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
93-96