DOI：10.3969/j.issn.1001-3695.2009.09.057

统计和规则相结合的并列结构自动识别

引用

摘要：

并列结构的自动识别是语言信息处理中的难点,采用统计和规则相结合的方法对并列结构的边界进行了识别.首先,根据连接词的位置,使用最大熵模型分别从左和从右识别出并列结构的左边界和右边界;接着,根据并列结构的特性对自动识别的左右边界使用预定义的规则进行后处理,得到最终左右边界.实验的训练集和测试分别包含12 396和1 219个并列结构.实验表明,该方法性能达到了78.1%,其中后处理加入规则的使用提高了3.4%.

关键词：并列结构、并列成分、最大熵模型

所属期刊栏目：26

分类号：TP391(计算技术、计算机技术)

资助基金：国家"863"计划资助项目2006AA01Z147;国家自然科学基金资助项目60673041

在线出版日期：2009-11-03（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：3403-3406

英文信息展示

期刊专题