融合从底向上与自顶向下的中文复杂句人工标注方法
大规模、高质量的中文树库的建立对中文句法分析的发展有着重要的意义,但是对于字数多、结构层次复杂的中文复杂句的标注仍费时费力并且标注质量不高.这严重影响了中文树库的建立速度,阻碍了中文句法分析的发展.因此,该文提出一种融合了从底向上和自顶向下的中文复杂句标注方法,该方法将复杂句切分成结构较简单的块进行分析.实验表明,与传统的从底向上的标注方法相比,该文中的方法的校对速度快于传统方法,且整体差异率和分阶段的差异率降低了约20%,说明该文中的方法在对中文复杂度的标注是有效的且实用的.
概念复合块、从底向上语料标注方法、从底向上和自顶向下语料标注方法
37
TP391(计算技术、计算机技术)
国家自然科学基金项目61271304,61373075;北京市教委科技发展计划重点项目标暨北京市自然科学基金B类重点项目KZ2013112307
2016-10-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
716-721