基于最大熵的维吾尔语句子边界识别模型

引用

摘要：

采用最大熵模型实现维吾尔语句子边界识别,该模型的训练过程不需要提供手工收集规则、词性标注及形态分析,仅使用较容易获取的单词长度和音节等特征.为确定最佳特征模板,在特征空间上组合出不同特征模板进行测试.实验结果表明,最佳特征模板具有较强的鲁棒性,召回率可达97.72%.

关键词：维吾尔语、句子边界识别、特征选择、最大熵

所属期刊栏目：36

分类号：N945.12(系统科学)

资助基金：国家自然科学基金资助项目60663006;新疆维吾尔自治区高技术计划基金资助项目200712109;新疆维吾尔自治区高校科研计划基金资助重点项目XJEDU2008108

在线出版日期：2010-05-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：24-26,38

英文信息展示

期刊专题