10.3969/j.issn.1673-4785.2009.05.004
基于双向标注融合的汉语最长短语识别方法
汉语最长短语(最长名词短语和介词短语)具有显著的语言学特点.采用基于分类器的确定性标注方法进行双向标注,其结果能够显示最长短语识别在汉语句子正(由左至右)反(由右至左)2个方向上的互补性.基于此,利用确定性的双向标注技术来识别汉语最长短语,并提出了一种基于"分歧点"的概率融合策略以融合该双向标注结果.实验表明,这一融合算法能够有效发掘这2个方向的互补特性,从而获得较好的短语识别效果.
最长名词短语识别、介词短语识别、序列标注、双向标注、分歧点
4
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60736014、90820303;"十一五"国家科技支撑计划项目2006BAH03B02;国家"863"计划资助项目2006AA010108-4;中国新加坡数字媒体研究院资助项目.通信作者:鉴萍.E-mail:pjian@nlpr.ia.ac.cn
2010-01-26(万方平台首次上网日期,不代表论文的发表时间)
共8页
406-413