汉英句子对齐长度计算方法的研究
传统的基于长度的汉英双语句子对齐算法大都以字节作为汉英句子长度的计算单位.提出了几种不同的汉英句子长度计算方法,分别以句子所含动词、名词、形容词、实词、字节及所含全部词语个数作为句子的长度,进行基于长度的汉荚句子对齐.实验结果表明,汉英句子对齐以词语作为句子长度计算单位时,正确率为99.01%,召回率为99.5%.
自然语言处理、双语语料库、句子对齐、基于长度的方法、基于词汇的方法
30
TP391(计算技术、计算机技术)
河南省教育厅自然科学基金项目2007520050
2009-11-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
4356-4358,封3