英汉环保领域平行语料的句对齐与再对齐
从资源建设角度对现有基于统计的句对齐工具进行用户易用性及性能比较,认为Champollion比较适合英汉双语句对齐处理.借鉴“基于转换错误驱动”的思路,对Champollion对齐错误结果利用语言学规则实施再对齐,使句对齐效果进一步提升.以英汉环保领域专业文本为例,句对齐的准确率从最初的88.74%上升至93.91%.这种结合基于统计对齐工具和语言学知识应用的对齐和再对齐处理方法在“分步骤按领域”建设大规模双语语料库的过程中具有普适性.
英汉平行语料库、环保文本、句对齐、再对齐、基于转换错误驱动
TP361(计算技术、计算机技术)
教育部人文社会科学研究项目"基于语料库及对应词表的英语特异组合研究"09YJA740013;国家社会科学基金项目"服务信息检索的自然语言"11BYY051;教育部新世纪优秀人才支持计划项目NCET-11-0591的研究成果之一
2013-08-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
36-41