10.3969/j.issn.1672-9722.2010.12.010
基于最大熵的中文组织机构名识别模型
中文组织机构名识别的精确率一直是影响自然语言处理的因素之一.根据中文组织机构名的特点,提出采用最大熵的识别方法.实验系统在较大规模的数据集上对比了不同特征选择方法对模型的影响,同时考查了词面、词性、语法等信息对模型的贡献.实验结果表明,不同的特征选择算法,开放测试的平均值只相差0.2~0.5个百分点.
最大熵、中文组织机构名、识别、自然语言处理
38
TP311(计算技术、计算机技术)
2011-03-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
36-40