10.3969/j.issn.1001-0645.2006.06.008
最大熵和Brill方法结合识别英语BaseNPs
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比.
基本名词短语、短语识别、最大熵、Brill方法
26
TP301.2(计算技术、计算机技术)
国家部级科研项目504-4
2006-07-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
500-503