10.3321/j.issn:1002-8331.2006.25.052
基于句子比较的英汉翻译模板自动提取算法
模板的自动抽取算法对机器翻译的研究具有重要意义.从面向英汉翻译的角度出发,论文对基于句子比较的翻译模板抽取(ATTEBSC)算法及其改进开展了比较研究,结果发现传统ATTEBSC算法在处理大规模语料库时运行效率较低,而且产生的无用模板比例较高,其中一个重要原因是没有事先对双语对齐语料库进行分类处理.通过相似性分析对句子进行聚类处理后再运行ATTEBSC算法,则发现该算法的运行效率和有用模板的比例都获得了较大的提高.
句子比较、模板、分类、机器翻译
42
TP18(自动化基础理论)
北京市自然科学基金4052005;北京市教委科技发展计划Km200310005013
2006-09-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
176-179